Teoria dos Conjuntos 


3 de Agosto de 2012 


Conteúdo 


1 Introdução 


2 Lógica de primeira ordem 
Dal, O altabeto, 213 selado Bad io SAS ado p MOD do DB da E e À ED es 
22: Fórmulas osa era on Ga E ud Mb AT RÉ a DÁ e DS, E ua CEP 
2.3 Unicidade de representação... oaoa a 
2.4 Omissão de parênteses et mm ade Ga CE MET Ep ME e EUA 2 08 0 
25. NVarlavels NTESO. cs uoa são ERES ana A (ag nei ADA pf Cas E JAPAO Cs AS TAER a 
26r Abpreviatüras ase E pan q a E a e E AE a ES SS 
2.7 Sistema de axiomas . .Lcccccccc a a 
2.8 Notas sobre símbolos relacionais e funcionais . . . . o.o. a 000a 
2.9 Notas sobre a semântica pes md a a Gee EE Cape SE Sp a 


3 Axiomas da extensão e do vazio 

4 Axiomas do par, da união e das partes 

5 Axioma da separação — Paradoxo de Russell 
6 Axioma da regularidade 

7 Axioma da infinidade — números naturais 


8 Produto cartesiano e relações 
8.1 Pares ordenados . . . o. oaoa Se Spear ess ATA APAE AE gm 
8:2- Prodüto cartesiano s.: siga pa san Pop Se ae e a a 
8:3- Relações isheri E an a a a D a e a a RS aa O a A 


9 Funções 


10 Construção dos conjuntos numéricos 
10.1 Teorema da recursão . . o.oo a E ED E SD E 
10.2 Aritmética dos números naturais . . . o.o oo a a a a 
10.3 Relação de equivalência. . . . 0a o a a 
10.4 Construção do conjunto dos números inteiros . . cc clic. 
10.5 Construção do conjunto dos números racionais . . . . . o.oo 
10.6 Construção do conjunto dos números reais . . . . o.o ooo a 


3 


4 CONTEÚDO 


11 Relações de ordem 65 
12 Indução e recursão transfinitas 71 
13 Axioma da escolha 75 
14 Conjuntos equipotentes 85 
15 Axioma da substituição 93 
16 Ordinais 97 
17 Aritmética ordinal 103 


18 Cardinais 111 


Capítulo 1 


Introdução 


O infinito sempre assombrou os matemáticos e filósofos, estando relacionada aos 
maiores paradoxos e crises nos fundamentos da matemática, como é o caso dos 
famosos paradoxos de Zeno, de Eléia, que se baseiam em interpretações tortuosas 
do conceito de infinitude para “provar” a não existência de movimento. 

No desenvolvimento da teoria dos conjuntos, o conceito de infinito desepenha 
um papel fundamental, sendo responsável por uma das maiores crises filosóficas na 
história da matemática. Como efeito dessa “crise”, tivemos pressupostos matemáticos 
e filosóficos sendo destruídos, novos questionamentos surgindo, divergências na própria 
concepção de verdade matemática, novas propostas de formalização da disciplina. 
Enfim, como aconteceu com as grandezas incomensuráveis e a história do quinto pos- 
tulado de Euclides (esses dois também estão diretamente relacionados ao conceito de 
infinitude) os paradoxos da teoria dos conjuntos contribuíram enormemente para o 
enriquecimento do pensamento matemático. 

Vamos refletir um pouco sobre o conceito de conjuntos. Podemos pensar em 
conjunto como um agrupamento de objetos que compartilham uma propriedade co- 
mum !. Assim, podemos pensar na palavra pássaro como um conjunto de animais 
que possuem certas características, como o corpo coberto de penas e reprodução 
ovípora. Cada descrição de objetos, animais ou pessoas nos fornece um conjunto. 
Por exemplo: o conjunto dos pássaros que voam, ou o conjunto dos alunos da USP. 

Podemos considerar a noção de conjuntos como um dos primeiros conceitos ab- 
stratos da mente humana. Um pássaro é um ser vivo que existe independente do pen- 
samento humano (se deixarmos um pouco de lado excesso de divagações filosóficas). 
Mas a noção de pássaro — o conjunto de todos os pássaros do mundo — é uma noção 
abstrata, criada pelo nosso raciocínio. 

O surgimento dos números naturais — uma das criações mais úteis do pensamento 
humano e um dos alicerces da matemática — pode ser visto como consequência da 
noção de conjuntos. Dizem alguns historiadores que, há muitos séculos atrás, antes 
de existir a contagem, os pastores usavam um saquinho de pedras para não perderem 


Hsso está longe de ser uma definição. Seria difícil definir conjunto sem usar algum termo como 
agrupamento, coleção, ou outro que seja praticamente sinônimo de conjunto. Conjunto deve ser 
tratado como conceito primitivo, que não requer definição. O propósito deste parágrafo é discutir- 
mos um pouco a ideia intuitiva de um conceito que já conhecemos, antes de entrar na abordagem 
axiomática. 
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as ovelhas. Quando levavam as ovelhas para pastar, para cada ovelha que passava 
guardavam uma pedrinha. Na hora de recolher as ovelhas, para cada ovelha que 
voltava ao curral, retiravam uma pedrinha. Se, no final, não sobrasse nenhuma pedra 
no saquinho, eles podiam se assegurar de que nenhuma ovelha se perdeu 2. 

Dessa forma, estabeleceu-se uma semelhança entre o conjunto das pedras que 
um pastor levava em um saquinho e o conjunto das ovelhas que eles possuía: am- 
bos têm a mesma quantidade de elementos, já que podemos associar biunivocamente 
cada elemento de um conjunto com um elemento de outro. Com o tempo, as pes- 
soas perceberam que não havia necessidade de usar pedras de verdade, e inventaram 
um conceito abstrato chamado número (os números naturais). Cada número rep- 
resentava uma possível quantidade de elementos de um conjunto. Assim, o número 
1 representava todos os conjuntos existentes que possuem 1 elemento. O número 2, 
todos os conjuntos que possuem 2 elementos, e assim por diante. E como saber a 
quantidade de elementos que cada conjunto contém? Bastava colocar os números em 
uma sequência (0, 1, 2, 3 etc.) e a cada elemento novo que colocamos num conjunto 
avançamos um número na sequência. Por exemplo, se um conjunto não tem nenhum 
elemento, ele é rotulado pelo número 0. A partir do momento que colocamos alguma 
coisa nesse conjunto, seu tamanho é “promovido” a 1, e assim por diante. 

Nessas “trivialidades primitivas” é impressionante quantos conceitos complexos 
(ou considerados complexos) da matemática moderna estão sendo abordados: funções 
bijetoras, classe de conjuntos, relação de equivalência, ordinais, cardinais etc. Não é 
fácil explicar para uma pessoa ainda não familiarizada com a linguagem formal da 
matemática o que é uma função bijetora. Todavia, até uma criança consegue contar 
o número de brinquedos que tem, e observem como é esse processo de contagem: 


e À criança aponta com o dedo para um brinquedo e diz, em voz alta, o número 
1. 


e À criança aponta para outro brinquedo e diz 2, e assim sucessivamente na 
sequência dos números. 


e À criança toma o cuidado de não apontar duas vezes para o mesmo brinquedo 
(não “contar repetido”). 


e À criança toma o cuidade de não deixar de apontar para nenhum brinquedo. 


No final, o último número mencionado pela criança durante a contagem — 
quando todos os brinquedos já foram contados — é a quantidade de brinquedos 
que ela possui. 


Ou seja, a criança que contou e descobriu que tinha 10 brinquedos soube per- 
feitamente construir uma bijeção entre o conjunto dos brinquedos e o conjunto dos 
números que vão de 1 a 10. A cada número ela associou um brinquedo (função), 
números diferentes foram associados a brinquedos diferentes (função injetora) e cada 
brinquedo foi associado a um número (função bijetora). 


2 Alguns sustentam essa teoria com base na origem da palavra cálculo, que vem do latim calculus, 
que significa pedra. 


Uma mente mais crítica pode levantar duas questões. A primeira: será que, no 
processo de contagem, chegaremos sempre ao mesmo número, indepente da sequência 
que seguimos? Ou seja, se a criança começar a contar pelo carrinho e depois ir para o 
boneco, ou fazer o contrário, chegará no mesmo resultado? A segunda questão: será 
que os números naturais são suficientes para contar a quantidade de elementos de 
qualquer conjunto? Ou seja, sempre haverá um momento em que a contagem pára 
em um determinado número? 


É justamente aí que os problemas começam. As respostas a essas perguntas são 
sim, e sim, mas apenas para os conjuntos finitos. Aliás, essa pode ser justamente 
a definição de conjunto finito: quando existe uma bijeção entre ele e o conjunto dos 
números menores que um determinado número. 


Reparem na sutileza no desenvolvimento do conceito de conjuntos. A princípio, 
conjunto é um conceito abstrato, mas até agora citamos exemplos de conjuntos forma- 
dos por objetos concretos, como ovelhas, brinquedos e pessoas. Esse tipo de conjunto 
é sempre finito. Às vezes, não conseguimos contar por impossibilidade física. Quando 
dizemos, na linguagem natural, que a quantidade de areia na praia e a quantidade 
de estrelas no céu são inumeráveis 3, dizemos que é humanamente impossível contar. 
Mas existe uma quantidade finita delas. Existe um número natural que representa 
a quantidade de estrelas no céu, mesmo que nunca venhamos a saber qual é esse 
número. Até mesmo a quantidade de átomos no universo é finita, por mais que seja 
espantosamente grande. 


Acontece que, a partir do momento que criamos conceitos abstratos — como con- 
juntos e números — podemos imaginar conjuntos não só de objetos concretos, mas 
também de objetos abstratos. Assim, uma vez que inventamos os números naturais, 
podemos pensar no conjunto dos números naturais. Como, para qualquer número 
natural, sempre existe um maior, então o conjunto dos números naturais é infinito. 


O conjunto dos números naturais não é o único conjunto infinito que existe. 
Temos o conjunto dos pontos de uma reta, o conjunto das retas em um plano, o 
conjunto das frações, o conjunto dos números reais etc. Mas todos esses conjuntos 
são fomados por conceitos abstratos, e não por objetos concretos. Não é à toa, 
portanto, que a ideia de infinitude seja tão difícil de assimilar e, por muitas vezes, 
traia a nossa intuição e senso comum. 


Agora voltemos à primeira questão: será que a ordem que utilizamos para contar 
as coisas não afeta o resultado? Ora, ninguém havia pensado nessa questão em 
conjuntos infinitos. Afinal, um conjunto infinito é infinito e pronto. Não tem como 
contar os elementos de um conjunto infinito. Porém, algumas mentes mais aguçadas 
ousaram entrar a fundo nas questões filosóficas da infinitude. O cientista italiano 
Galileu Galilei (1564-1642) decidiu usar a noção de funções bijetoras para comparar 
conjuntos infinitos, chegando em um resultado bem curioso. Ele considerou a função 
que associa, a cada número natural, o seu dobro, conforme o diagrama seguinte: 


3Não confundir com enumeráveis, que é um conceito exclusivamente matemático, como será visto 
daqui a pouco. 
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Com isso, Galilei mostrou que o conjunto dos números naturais “tem o mesmo 
tamanho” que o conjyunto dos números pares. Na época, isso parecia contradizer o 
axioma de Euclides que dizia que “o todo é sempre maior que a parte”. O conjunto 
dos números pares é apenas uma parte do conjunto de todos os números naturais, 
e ainda assim ambos os conjuntos têm o mesmo tamanho, se utilizarmos essa noção 
de bijeções. Notem que isso só acontece com conjuntos infinitos. Em um conjunto 
finito, se tirarmos um único elemento já não conseguimos associar biunivocamente os 
elementos do conjunto reduzido com os do conjunto todo. 


O hotel de Hilbert O matemático alemão David Hilbert (1862-1943) deu um 
exemplo parecido. Se chegamos em um hotel e todos os quartos estão ocupados, 
então sabemos que não há vaga nesse hotel, a menos que uma família saia. Agora 
imaginemos um hotel com infinitos quartos — um para cada número natural — sendo 
que todos estão ocupados. Chega uma nova família querendo se hospedar e o dono 
não quer despejar nenhum hóspede, mas também não quer recusar quarto para os 
recém-chegados. Como há infinitos quartos — mesmo que todos ocupados — é fácil 
resolver o problema. Basta passar cada hóspede para o quarto ao lado. Assim, quem 
está hospedado no quarto 0 vai para o quarto 1, e do quarto 1 para o 2, e assim por 
diante, sobrando o quarto O para os novos hóspedes. 

O problema do dono do hotel parece se complicar quando chega um ônibus com 
uma infinidade de hóspedes, um hóspede para cada número natural. Mas a solução 
ainda é simples: ele passa cada hóspede de um quarto para outro cujo número é o 
dobro do primeiro. Sobra, assim, todos os números ímpares para colocar os novos 
hóspedes. 

E se chegarem infinitos ônibus — cada ônibus marcado por um número natural 
diferente — com infinitos passageiros cada um — cada passageiro também marcado 
por um número — poderá ainda o dono do hotel hospedar todo mundo? Sim. E 
poderá fazê-lo de forma que não fique nenhum quarto vazio. Basta colocar o n-ésimo 
passageiro do m-ésimo ônibus no quarto 2” - (m + 1) (para simplificar, desta vez 
assumimos que o hotel está vazio — fica como exercício verificar o que se faria se o 
hotel estivesse lotado). 


O paraíso de Cantor Aparentemente o paradoxo criado por Galilei não causou 
tanto impacto na matemática e na filosofia, nem foi devidamente explorado durante 
alguns séculos. Foi só no século XIX que o assunto foi trazido novamente à tona pelo 
matemático alemão Georg Cantor (1845-1918). Dessa vez, o impacto transformou 
totalmente o rumo da matemática moderna e deu início à teoria dos conjuntos, que 
será estudada neste curso. 


Cantor não só criou um paradoxo ou uma discussão filosófica através dessa ideia 
de comparar tamanho de conjuntos infinitos: ele de fato resolveu um problema 
matemático usando esse conceito. Enquanto outros matemáticos tiveram uma grande 
dificuldade para provar que números como 7 e e são transcendentes (isto é, não são 
raízes de equações polinomiais de coeficientes inteiros), Cantor provou, de maneira 
relativamente simples, que existem muitos números transcendentes, mesmo sem exibir 
um sequer. Vamos aqui tratar brevemente dessa demonstração. 


O conjunto dos números algébricos (os não transcendentes) aparentemente é 
muito maior que os números naturais. Para começar, esse engloba todos os racionais, 
uma vez que a fração 7 é raiz da equação bx — a, e quase todos os números reais que 
conhecemos. Os transcendentes parecem ser estranhas exceções dentro do conjunto 
dos números reais. Se os irracionais já parecem aberrações, mais ainda os números 
transcendentes. Pois Cantor provou justamente o contrário: há muito mais números 
transcendentes do que algébricos. De fato, o conjunto dos números algébricos tem o 
mesmo tamanho que o conjunto dos números naturais. 


Estabelecer uma bijeção entre os números naturais e os algébricos não é difícil. 
Primeiro, precisamos estabelecer uma bijeção entre os números naturais e os polinômios 
de coeficientes inteiros, ou seja, colocarmo-los numa sequência, como uma fila infinita. 


O início da sequência deve ser constituída pelos polinômios de grau 1 e cujos 
coeficientes têm módulo menor ou igual a 1. Está claro que existe apenas uma 
quantidade finita desses polinômios. Podemos dispô-los em ordem lexicográfica, como 
a usada em dicionários, conforme descrevemos abaixo. 


Continuamos a sequência escrevendo os polinômios de grau menor ou igual a 2, 
cujos coeficientes têm módulo menor ou igual a 2, e que não estão na lista anterior. 
Usamos a mesma ordem lexicográfica dos coeficientes, começando com os polinômios 
de grau menor (ou maior, como queiram). Prosseguimos esse processo para 3, 4 e 
assim por diante, e isso irá contemplar todos os polinômios de coeficientes inteiros, 
conforme ilustra o seguinte diagrama: 
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0 ss —x— 1 
1 — -T 

2 —> —xz +1 
3 — x-1 
4 > £ 

5 — x+1 
6 — —2x — 2 
T — —2x— 1 
8 + —2x 

9 es —2x + 1 
10 —> —2x + 2 
11 —s 2x — 2 
12 —s 2x— 1 
13 —- 2x 
14 —s 2x +1 
15 —s 2x +2 
16 «+ —2r?— 2-2 


17 —— sp =D 


Agora, para “colocarmos em fila” os números algébricos basta substituirmos cada 
polinômio pelas suas raízes (em ordem crescente), suprimindo os que já foram listados. 
Fazendo assim obtemos: 


0 ~ —1 (raiz do polinômio —x — 1) 

1 —s 0 (raiz do polinômio —x) 

2 es 1 (raiz do polinômio —z + 1) 

3 > —¿ (raiz do polinômio —2x — 1) 

4 > ¿$ (raiz do polinômio —2x + 1) 

5 — E (primeira raiz de —272 — 2x + 1) 
6 — DRO (segunda raiz de —2x? — 2x + 1) 


Com isso Cantor mostrou que o conjunto dos números algébricos “tem o mesmo 
tamanho” que o dos números naturais. Isso significa dizer que o conjunto dos números 
algébricos é enumerável, ou seja, podemos enumerar todos seus elementos numa lista 
infinita, indexada com os números naturais. 

É fácil intuir 4 que um subconjunto infinito de um conjunto enumerável é enu- 
merável. Assim, os conjuntos dos números inteiros, racionais e algébricos são todos 
enumeráveis. 

A essa altura começamos a imaginar que todos os conjuntos são enumeráveis. 
Talvez por isso o aparente paradoxo de Galilei não tenha impactado tanto os matemáticos. 
Infinito é infinito e parece natural que todos os conjuntos infinitos tenham o mesmo 
tamanho. Parece que, se nos esforçarmos bem, como fizemos com os números algébricos, 


4A demonstração rigorosa desse fato é mais trabalhosa, como veremos posteriormente. 
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conseguimos colocar qualquer conjunto infinito numa sequência bem comportada. 
Porém, Cantor surpreende a todos ao provar que o conjunto dos números reais não 
é enumerável. 

Vejamos a prova de Cantor da não-enumerabilidade dos números reais. Seja f 
uma função de N em R. Mostraremos que f não pode ser sobrejetora. 

Para cada n natural, consideremos a, a parte inteira de f(n) e (anm)meN à 
sequência dos algarismos após a vírgula na representação decimal * de f(n). 


f0) = 40; 400; Q01, Q02, Q403... 
fO) = Q1, 010; Q11, 012; Q13 --- 
f(2) = Q2, 020; A21, 422, Q23 - - - 
f (3) = as, a30, a31, 432, Ogg... 


Agora mostremos que existe um real r que não pertence a essa lista. Definimos 
r da seguinte forma: a parte inteira pode ser qualquer número (0, por exemplo) e 
a n-ésima casa decimal de r será 1 se ann for O e será O caso contrário. Portanto, 
para todo n teremos que a n-ésima casa de f(n) difere da n-ésima casa de r, de onde 
concluímos que r não está na imagem de f. 

Ou seja, escolhemos um número real que “evita” a diagonal da matriz infinita 
formada pelas casas decimais de cada número real da sequência. Essa prova ficou 
conhecida como argumento diagonal de Cantor *. 

Com isso Cantor mostrou que o conjunto dos números reais é não-enumerável, 
isto é, realmente a quantidade de números reais é maior que dos números naturais. 
Ora, se o conjunto dos números algébricos é enumerável, e o conjunto dos números 
reais é não-enumerável, concluímos que existem infinitos números reais que não são 
algébricos. 

Concluímos também que há uma bijeção entre os números reais e os transcen- 
dentes. De fato, considere em R uma sequência (x, )nen de números transcendentes 
distintos (por exemplo, x, pode ser T +n) e (an )nen à sequência de todos os números 
algébricos (lembre-se que os algébricos são enumeráveis). Podemos definir uma função 
bijetora do conjunto dos números reais nos transcentendes da seguinte forma: cada 
an é mapeado para £ən, cada x, é mapeado para 73,12, € os demais números são 
mapeados para eles mesmos. 


A demonstração de Cantor causou uma das maiores controvérsias da história da 
matemática. Para alguns, essa prova desvirtua o propósito da matemática e perde 
relação com o mundo real. Para outros, foi uma inovação no pensamento abstrato e 
um grande passo para a Rainha das Ciências. O matemático francês Henry Poincaré 
(1854-1912) chegou a dizer que “o cantorismo é uma doença da qual a matemática 
precisa se curar ””, enquanto, por outro lado, David Hilbert reagia às críticas a Cantor 
dizendo que “ninguém nos tirará do paraíso criado por Cantor”” 


5 Aqui assumimos que a representação decimal é aquela que nunca utiliza uma dízima de período 
9. Ou seja, a representação decimal de 1 que consideraremos é 1,000..., e não 0,999... 

Um argumento semelhante foi usado por Gödel em uma parte crucial da demonstração do 
Teorema da Incompletude. 
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Teoria dos conjuntos nos fundamentos da matemática Apesar dos protestos 
dos construtivistas e intuicionistas, a matemática moderna cedeu à elegância da teoria 
dos conjuntos desenvolvida por Cantor, Zermelo, Frankel e Von Neumann, dentre 
outros, e fez dela um dos pilares — ao lado da lógica de primeira ordem — da sua 
fundamentação. Pelo menos é o que aceita a maioria da comunidade matemática 
atual. 

A ideia de usar conjuntos para formalização da matemática é definir todos os 
objetos matemáticos como conjuntos. Tudo é conjunto. Cada número natural é um 
conjunto, uma função é um conjunto, uma relação é um conjunto, os elementos de 
um conjunto são, eles próprios, conjuntos. 

Inicialmente, o conceito de conjuntos estava diretamente ligado a fórmulas da 
linguagem de primeira ordem com uma variável livre. Por exemplo, a fórmula 3Jy(x = 
2-y) tem x como variável livre e, se pensarmos no universo dos números naturais, 
representa o conjunto dos números pares. Um conjunto, então, é determinado por 
uma propriedade, conforme explicamos no início deste capítulo. 

Gottlob Frege (1848-1925) tentou levar essa ideia adiante, propondo uma formal- 
ização da matemática em que lógica e conjuntos eram praticamente indissociáveis. 
Porém, Bertrand Russell (1872-1970) encontrou uma inconsistência nessa formal- 
ização, através do seu famoso paradoxo ”. 


Se qualquer propriedade determina um conjunto, então podemos definir um 
conjunto X como o conjunto de todos os conjuntos que não pertencem a si mes- 
mos 8 Surge a pergunta: X pertence a si mesmo? Se sim, então, pela sua definição, 
ele não pode pertencer. Se não pertence a si mesmo, novamente usando sua definição, 
concluímos que ele pertence. Chegamos numa inevitável contradição, que só se re- 
solve não permitindo a existência de tal conjunto. 

Isso destrói a proposta de Frege de unificar conjuntos e lógica, relacionando um 
conjunto com uma sentença que descreve seus elementos. A existência de um conjunto 
precisava ser mostrada, a partir de uma lista de axiomas, não sendo mais sua definição 
o suficiente para garantir a sua existência. 

Ernst Zermelo (1871-1953) e Abraham Fraenkel (1891-1965) foram os responsáveis 
pela formalização axiomática dos conjuntos, que, em sua homenagem, ficou con- 


"Esse paradoxo possui uma variança popular conhecido como paradoxo do barbeiro, que dizia 
que havia numa cidade um barbeiro que cortava o cabelo de todas as pessoas que não cortavam seu 
próprio cabelo, e apemas dessas. 

8Podemos nos perguntar se é possível um conjunto pertencer a si próprio. Nota-se que há uma 
diferença entre pertencer a si próprio e estar contido em si próprio. Essa confusão entre as duas 
relações é muito comum, devido a uma falha clássica do ensino de matemática no nível básico, que 
será discutida melhor durante o início da disciplina. Um conjunto sempre está contido nele próprio, 
mas poderá pertencer a si próprio? 

Se permitirmos livremente a construção de conjuntos através de uma expressão que descreve todos 
seus elementos, e ainda utilizarmos a linguagem natural, cheia de auto-referências, podemos definir 
o conjunto de todos os objetos que podem ser descritos com menos de vinte palavras. Certamente 
esse conjunto, se assim existisse, pertenceria a ele próprio. Ou, um exemplo mais simples, se existir 
o conjunto de todos os conjuntos, ele pertence a si próprio. 

Porém, veremos posteriormente que, pelo axioma da regularidade, na teoria axiomática dos con- 
juntos não é possível um conjunto pertencer a si mesmo. Muito menos existe um conjunto de todos 
os conjuntos . 
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hecida como sistema ZFC. A letra C vem do inglês choice, uma referência ao axioma 
da escolha, que, pelas polêmicas em torno dele, costuma ser “evitado” por alguns 
matemáticos. Assim, nos referimos ao sistema ZF quando excluímos o axioma da es- 
colha, e ZFC quando o utilizamos. Vários matemáticos gostam de deixar bem claro 
quando um resultado usa esse axioma, fazendo bastante esforço para não precisar 
lançar mão dele. 

Embora o sistema ZFC tenha sido criado por Zermelo e Fraenkel, parte da formal- 
ização que temos hoje é atribuído a John von Neumann (1903 — 1957), que também 
teve grande participação na invenção do computador moderno. 

A lógica e a teoria dos conjuntos passaram a seguir caminhos separados — porém 
entrelaçados — na formalização da matemática. O próximo capítulo trata dessa dico- 
tomia. 


Exercícios 


1. Mostre uma bijeção entre o conjunto dos números inteiros e os naturais. 
2. Prove que qualquer subconjunto infinito dos números naturais é enumerável. 


3. Na bijeção que construímos entre os números naturais e os polinômios, encontre 
o polinômio associado ao número 30. 


4. Na bijeção que construímos entre os números naturais e os números algébricos, 
encontre o número natural associado ao número v3 


5. Suponha que, em um conjunto infinito, existe uma forma de representar cada ele- 
mento do conjunto como uma sequência finita de símbolos, dentre um conjunto finito 
de símbolos. Mostre que esse conjunto é enumerável e use esse resultado diretamente 
para mostrar que os conjuntos dos números racionais e dos números algébricos são 
enumeráveis. 
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CAPÍTULO 1. INTRODUÇÃO 


Capítulo 2 


Lógica de primeira ordem 


Antes de falarmos sobre a teoria dos conjuntos, precisamos de algumas noções sobre 
a lógica de primeira ordem, que será usada em sua formalização. 

Há um círculo vicioso entre lógica de primeira ordem e teoria dos conjuntos. A 
formalização de uma depende da formalização da outra. Seja como for que lidemos 
com essa dicotomia, em algum momento precisamos apelar para a abordagem intu- 
itiva da outra. Ou seja, podemos desenvolver toda a teoria dos conjuntos de forma 
axiomática mas utilizando a linguagem natural (tal como Halmos faz em seu livro, 
e também como é feito nas disciplinas de Análise Real e Álgebra) para, posterior- 
mente, formalizarmo-la com a lógica de primeira ordem (que possui a vantagem de 
ser muito próxima à argumentação que costumamos fazer na linguagem natural, para 
provarmos teoremas matemáticos). Ou podemos estudar lógica primeiro, utilizando 
noções intuitivas de teoria dos conjuntos — tais quais aprendemos no Ensino Médio 
— para depois desenvolvermos a teoria dos conjuntos axiomaticamente. Seguiremos 
aqui uma terceira opção: apresentar apenas uma parte da lógica de primeira ordem 
(a sintaxe) — que requer apenas uma parcela mínima de noções intuitivas de conjuntos 
e aritmética — para depois formalizar a teoria dos conjuntos com o rigor da lógica. 

Podemos separar a lógica de primeira ordem em três aspectos: a linguagem, 
o sistema de axiomas e a semântica. Os dois primeiros constituem a sintaxe da 
lógica de primeira ordem, que trata da manipulação dos símbolos através de regras 
bem definidas, livre de contexto e de significado. A semântica trata justamente do 
significado das expressões lógicas. É justamente na semântica que o uso de teoria 
dos conjuntos é mais evidente e, por essa razão, trataremos aqui apenas da parte 
sintática, fazendo apenas alguns comentários a respeito da semântica. 

A lógica de primeira ordem pode se adaptar a vários contextos, apresentando 
símbolos específicos de algum assunto que quisermos axiomatizar. Assim, para ax- 
iomatizar a aritmética utilizamos alguns símbolos específicos da aritmética, como +, 
x, 0 e 1. Na teoria dos conjuntos, o símbolo específico será o de pertinência (€). 
Por isso, muitas vezes, em vez de dizermos a lógica de primeira ordem, dizemos uma 
lógica de primeira ordem, ou uma linguagem de primeira ordem. 

Aqui trataremos especificamente da linguagem da teoria dos conjuntos. Não 
demonstraremos nenhum dos teoremas aqui enunciados !. Como referência recomen- 


lOs teoremas a respeito da lógica de primeira ordem fazem parte do que chamamos de meta- 
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damos o livro Set Theory and Logic, de Robert Stoll. 


2.1 O alfabeto 
Os símbolos utilizados na linguagem da teoria dos conjuntos são os seguintes: 


Variáveis: representadas pelas letras minúsculas: 1x,y,2,.... Eventualmente, são 
indexadas pelos números naturais: £1, £2, £3, .... 


Conectivos: — (negação — “não”), — (condicional — “se. .. então”), A (conjunção — 


aD 


e”), V (disjunção — “ou” ), — (bicondicional — “se, e somente se”). 


Quantificadores: Y (quantificador universal — “para todo”), 3 (quantificador exis- 
tencial — “existe” ). 


Parênteses: são os parênteses esquerdo e direito: (e ). 
Símbolo de igualdade: = 


Predicado binário: € (pertence). 


2.2 Fórmulas 


Fórmulas são sequências finitas de símbolos do alfabeto que seguem as seguintes 
regras: 


1. Sex ey são variáveis, x € ye x = são fórmulas. 


2. Se A e B são fórmulas, =(4), (A) > (B), (A) A (B), (A) V (B) e (A) => (B) 


são fórmulas; 


3. Se A é fórmula e x é uma variável, então Vx(A) e Jx(A) são fórmulas. 


4. Todas as fórmulas têm uma das formas descritas nos itens 1,2 e 3. 


Por exemplo, pela regra 1, temos que x € y é uma fórmula. Pela regra 1, x = z 
também é uma fórmula. A regra 2 nos garante que (x € y) > (x = z) é uma 
fórmula. Logo, a regra 3 nos garante que Va((x € y) > (x = 2)) é uma fórmula. 


matemática, isto é, a matemática utilizada para formalizar a matemática. A lógica de primeira 
ordem é a linguagem utilizada na matemática. Então nos perguntamos qual é a linguagem utilizada 
quando formalizamos a lógica de primeira ordem. Obviamente, utilizamos a linguagem natural, 
mas podemos, posteriormente, formalizá-la utilizando a própria ordem de primeira ordem. A essa 
linguagem que utilizamos para descrever a lógica de primeira ordem chamamos de metalinguagem. 

Em seu livro Uma Breve História do Tempo, Stephen Hawking menciona uma história que serve 
como uma curiosa alegoria para entendermos o que é metalinguagem e metamatemática: de acordo 
com algumas pessoas, a Terra era achatada e estava apoiada no casco de uma tartaruga gigante, 
sendo que essa tartaruga, por sua vez, estava apoiada no casco de uma outra tartaruga gigante, e 
assim sucessivamente. 
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De fato, é uma expressão que “faz sentido” (ou seja, entendemos o que ela significa, 
independente de ser verdadeira ou não). Traduzindo para a linguagem natural, seria 
o seguinte: “para todo x, se x pertence a y então x é igual a z”. Ou, simplesmente, 
“z é o único elemento de y”. 

As fórmulas usadas no processo de construção de fórmulas mais complexas são 
chamadas de subfórmulas. Por exemplo, A e B são subfórmulas de (A) > (B). No 
caso do nosso exemplo, as subfórmulas de Va((v ey) > (x = 2)) são x € y, £ = Z, 
(x ey) > (x = z) e, para alguns efeitos práticos, consideramos a própria fórmula 
Vr((x € y) — (x = z)) como subfórmula dela mesma. 

As fórmulas que constam no item 1 são chamadas de fórmulas atômicas, porque 
não podem ser divididas em subfórmulas menores. 


2.3 Unicidade de representação 


A regra 4 nos diz que as únicas fórmulas são aquelas que se enquadram numa das 
três anteriores. Ou seja, toda fórmula é da forma x ey, £x = y, (4), (A) > (B), 
(A) A (B), (A) V (B), (A) e (B), Vxz(A) ou Jz(A), onde x e y são variáveis e A 
e B são fórmulas. Uma questão importantíssima para evitarmos ambiguidades na 
limguagem é: toda fórmula pode ser escrita em apenas uma dessa maneira? Isto é, 
olhando para uma sequência de símbolos que representa uma fórmula, existe apenas 
uma maneira de lermos essa sequência de símbolos como uma dessas formas? 

A resposta é sim: se escrevemos uma fórmula de duas possíveis maneiras, tanto o 
símbolo quanto as variáveis e fórmulas envolvidas são as mesmas, nas duas maneiras. 
Não demonstraremos isso aqui. Apenas ressaltamos que esse é o papel dos parênteses 
na fórmula. Por exemplo, se não houvesse parênteses, considere a fórmula x € y — 
xz =zVz €x. Podemos cosiderá-la como da forma A — B, onde A é a fórmula z € y 
e B é a fórmula z = z V z € x, ou como da forma A V B, onde A é a fórmula z € 
y— x= z e B éa fórmula z € x. Assim, sem os parênteses não sabemos se se trata 
de uma disjunção ou de uma implicação, gerando uma ambiguidade que, inclusive, 
fará diferença na interpretação da fórmula. Porém, com a regra dos parênteses na 
formação das fórmulas, ou a escrevemos (x € y) > ((x = z) V (z € x)) — que 
não há outra forma de descrevermo-la senão da forma (A) — (B) — ou escrevemos 
((x ey) > (x =2))vV(z € x) — que é uma fórmula exclusivamente da forma (A) V (B). 

Há uma notação que dispensa o uso de parênteses e, mesmo assim, é livre de 
ambiguidades. Chama-se notação pré-fixada, ou notação polonesa, que consiste em 
colocar os símbolos na frente das fórmulas e variáveis. Por exemplo, no lugar de 
x E y escreveríamos € xy, no lugar de x = y seria = xy, em vez de (A) A (B) 
teríamos AAB. As fórmulas que acabamos de escrever ficariam >€ zyV = 12 € Z£ 
ou V >€ xy = xz € zx. Essa notação é elegante e evidencia a questão da unicidade, 
pois basta observarmos o primeiro símbolo para reconhecermos o formato da fórmula. 
Porém, como o leitor deve ter percebido, a leitura e compreensão das fórmulas escritas 
nessa notação não são nada intuitivas, e se tornam piores para fórmulas longas 2. 


2Quem já usou a calculadora financeira HP12C deve se lembrar que ela usa uma notação semel- 
hante, só que pós-fixada, em vez de pré-fixada. Ou seja, nessa calculadora pressionamos primeiro 
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2.4 Omissão de parênteses 


Como uma espécie de abuso de notação, às vezes omitimos alguns parênteses desnecessários 
para a correta compreensão da fórmula. Por exemplo, embora a forma correta seja 

(x = y)A(H(x € y)), podemos escrever simplesmente (x = y)A—(x € y), sem prejuízo 

da compreensão da fórmula. Outra situação é que evitamos o uso de parênteses é em 
torno de um quantificador, como no exemplo Vx(x € y) > dx(x € y). 

Em sequência de conjunções ou de disjunções também omitimos os parênteses. 
Por exemplo, podemos escrever simplesmente (x = y) V (x € y) V (y € x). Embora 
essa notação seja ambígua a respeito do formato — pois, apesar de sabermos que 
é uma fórmula do tipo (A) V (B), não tem como sabermos se A é x =ye B é 
(x € y) V (y € x), ou se A é (x = y) V (x € y) e B é y € z — as duas possíveis formas 
são logicamente equivalentes, ou seja, expressam o mesmo significado. 


2.5 Variáveis livres 


Cada lugar que surge uma variável dentro de uma subfórmula atômica de uma fórmula 
chamamos de ocorrência de tal variável. Por exemplo, a fórmula (x = y) V (x € 2) 
apresenta duas ocorrências da variável x, e uma de cada uma das variáveis y e 2. 
Na fórmula Vx(x = y), não consideramos o primeiro símbolo x como uma ocorrência 
da variável, pois não está numa subfórmula atômica. Ou seja, não consideramos 
como ocorrência de uma variável quando tal símbolo está imediatamente após um 
quantificador. 

Dizemos que uma ocorrência de uma variável y numa fórmula 4 está no escopo 
de uma variável x se a Á apresenta uma subfórmula da forma Vx(B) ou Jx(B), e essa 
ocorrência de y está em B. Por exemplo, na fórmula (x € y) A dx(y = x), a segunda 
ocorrência de 1 está no escopo da variável x, mas a primeira, não. 

Dizemos que uma ocorrência de uma variável x numa fórmula A é livre se tal 
ocorrência não está no escopo dela mesma. Chamamos de variáveis livres de uma 
fórmula A aquelas que apresentam pelo menos uma ocorrência em que é livre. Uma 
sentença é uma fórmula que não apresenta variáveis livres. 

Por exemplo, a fórmula —(x € y) (x não pertence a y) apresenta duas variáveis 
livres: xz e y. Não podemos, portanto, julgar tal fórmula como verdadeira ou falsa, 
pois não conhecemos quem é x ou quem é y. As variáveis correspondem ao pronome, 
na linguagem cotidiana. Se falarmos Ele foi à feira, a pergunta que naturalmente 
surge é: Ele quem? Se falarmos João foi à feira, ou alguém do prédio foi à feira, ou 
todo mundo do prédio foi à feira, então a frase fica mais completa, e ganha o status 
de sentença, que permite averiguar se a frase é verdadeira ou falsa. 

Digamos, então, que acrescentemos um quantificador no nosso exemplo. A fórmula 
Va-(a € y) tem apenas uma variável livre: que é y. A variável x não ocorre livre, pois 
só ocorre no escopo dela própria. A fórmula significa “para todo x, x não pertence 
a y”, ou, colocada de outra forma, “y não possui elementos”, ou, simplesmente “y é 
um conjunto vazio”. Observamos que, para julgarmos a fórmula como verdadeira ou 


os números (separados pela tecla “enter”) e depois pressionamos a operação para obtermos os re- 
sultados. 
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falsa, basta agora conhecermos quem é y. Em outras palavras, a fórmula em questão 
nos dita uma propriedade a respeito de y, enquanto a fórmula —(x € y) dita uma 
propriedade a respeito de x e de y. 

Se, porém, escrevemos IyVx—(a € y), não há mais variáveis livres nessa fórmula. 
Essa é uma sentença, cujo significado não depende mais de interpretarmos as variáveis. 
Essa sentença diz que existe um conjunto vazio, que veremos ser verdadeira. Se es- 
crevêssemos VyVr-(a E y) teríamos um significado totalemnte diferente, que seria 
todo conjunto é vazio. Claramente essa é uma sentença falsa. Mas é uma sentença, 
pois os símbolos estão dispostos numa ordem que faz sentido e não apresenta variáveis 
livres. 


Se 4 é uma fórmula e x e y são variáveis, denotamos por 4% a fórmula obtida ao 
substituirmos toda ocorrência livre da variável x pela variável y. Por essa notação, 
A é sentença se A? é igual a 4, para todas variáveis x e y. 

Frequentemente denotamos por P(x) uma fórmula que tem x como (única) variável 
livre, ou por P(x,y) uma fórmula que tem duas variáveis livres, x e y (e analogamente 
para outras quantidades de variáveis livres). Nesse caso, P(y) denota P(x)3. 

O motivo de utilizarmos a letra P nessa notação é justamente pelo fato de P(x) 
designar uma propriedade de x. Veremos mais para frente como criar fórmulas para 
representar propriedades como “x é um conjunto infinito”, ou “x é enumerável”. 


2.6 Abreviaturas 


À medida que desenvolvemos assuntos mais complexos, as fórmulas vão se tornando 
demasiadamente longas e ilegíveis. Para resolver isso, introduzimos novos símbolos 
que funcionam como abreviaturas para expressões maiores. O importante é que o 
processo de conversão da linguagem abreviada para a linguagem da lógica de primeira 
ordem seja perfeitamente claro. 

Comecemos a exemplificar isso com o símbolo de inclusão. Dizemos que x está 
contido em y se todo elemento de x pertence a y. A fórmula para designar inclusão 
é Vz((z € x) > (z € y)). Observe que essa fórmula tem duas variáveis livres, x e y. 
Abreviamos essa fórmula como x C y. 

Assim como o símbolo de pertinência, a inclusão é um predicado binário (ou 
símbolo relacional binário), pois relaciona uma propriedade entre dois objetos do 
universo (no caso, o universo dos conjuntos). Poderíamos ter introduzido o símbolo 
de inclusão entre os símbolos primitivos, como o de pertinência. Mas como a inclusão 
é perfeitamente definível a partir da pertinência e dos demais símbolos lógicos, é 
tecnicamente mais fácil utilizarmos o símbolo de inclusão apenas como abreviatura. 

Outras abreviaturas são um pouco mais sutis na transcrição. Por exemplo, o 
conjunto vazio é denotado por Ø. A rigor, para utilizarmos a expressão o conjunto 
vazio e denotá-lo por um símbolo, antes precisaríamos mostrar que ele existe e é único. 
Aceitemos esse fato, por enquanto, antes de o provarmos num momento oportuno. 

Saber utilizar corretamente essa abreviatura requer um pouco mais de atenção. 
Primeiro notemos que, ao contrário da inclusão, o conjunto vazio não se refere a uma 
relação entre objetos, mas a um objeto em particular, e, ao contrário das variáveis, 
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se refere a um objeto bem definido. Corresponde a um nome próprio na linguagem 
cotidiana. À esse tipo de símbolo, na lógica, chamamos de constante. 

Assim como as variáveis, as constantes são termos, isto é, se referem a objetos 
do universo. Podemos utilizá-las no lugar de uma variável em fórmulas atômicas. 
Por exemplo, Ø € x é uma fórmula na linguagem abreviada. Para encontrarmos 
o correspondente na linguagem original, precisamos explicar quem é Ú. Para isso, 
tomamos uma variável que não está na fórmula (y, por exemplo) e escrevemos da 
seguinte forma: 


Vy((Vz=(z E y)) > y € 2) 


Um importante detalhe da fórmula acima é que a ocorrência não-livre da variável 
x não mantém qualquer relação com a ocorrência livre que ocorre a seguir (se quis- 
erem, podem substituir x por z, tanto na primeira ocorrência, em x € y quanto após 
o V). A fórmula significa, numa interpretação literal, “para todo y, se y não possui 
elementos, então y é pertence a x”, ou, “para todo y, se y é vazio, então y pertence 
a x”, ou, simplesmente, “o conjunto vazio pertence a x”. Notem que essa fórmula 
apresenta x como a única variável livre. 

Descrevemos, a seguir, o processo formal dessa abreviatura: 


Seja B a sequência de símbolos obtida ao substituirmos todas as 
ocorrências livres de uma variável x numa fórmula A pelo símbolo (). 
Então B designará a fórmula Vx((Vy-(y € 1)) > (A). 


Outro exemplo que citaremos aqui é da união de conjuntos. A expressão x U y 
representa o conjunto formado pelos elementos que pertencem x ou a y. Ou seja, 
velzezUvol(zer)v(zegy)). 

Desta vez, essa abreviatura trata-se de um símbolo funcional binário, pois associa 
a cada dois objetos do universo um terceiro. Outros exemplos de símbolos funcionais 
binários são as operações + e x na aritmética. Eis o detalhamento do processo de 
abreviatura: 


Sejam A uma fórmula e x,y, z variáveis distintas. Seja B a sequência 
de símbolos obtida ao substituirmos toda ocorrência livre de z em A por 
q Uy. Então B designa a fórmula 


VeVul(wez) o ((w € x) V (w € y))) > 4) 


Para algumas finalidades — como no estudo da metamatemática ou na elaboração 
do sistema de axiomas, como será feito na seção seguinte — convém reduzirmos os 
símbolos primitivos ao mínimo possível. A partir de agora, passaremos a considerar 
como símbolo primitivo da linguagem apenas as variáveis, os parênteses, o símbolo 
de pertinência €, o símbolo de igualdade =, o quantificador universal V, a negação — 
e a implicação —. 

Definiremos a partir desses símbolos os demais anteriormente descritos: V, A, & 
. Eis as regras: 


D 
Lu 
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(A) V (B) é abreviatura para (~(A)) > (B); 
(A) A (B) é abreviatura para ~((~(A)) v (+(B)); 


) 
) 
(A) & (B) é abreviatura para ((A) > (B)) A ((B) > (A)); 

( 


Jz(A) é abreviatura para —(Vx(—(4))). 


Fica como exercício ao leitor entender, a partir da concepção intuitiva desses 
símbolos, o porquê dessas abreviaturas. 


2.7 Sistema de axiomas 


O sistema de axiomas da lógica de primeira ordem é composto de sete axiomas e 
duas regras de inferência. Na verdade, são cinco esquemas de axiomas, pois cada um 
representa uma lista infinita de axiomas. 

Uma demonstração matemática é uma sequência de fórmulas onde cada uma ou 
é um axioma ou é obtida das fórmulas anteriores através de uma regra de inferência. 
Um teorema é qualquer fórmula que conste em uma demonstração. 

Os axiomas apresentados aqui são os axiomas lógicos, que valem em qualquer 
teoria que utiliza a lógica de primeira ordem. Esses axiomas traduzem os argumen- 
tos comuns que utilizamos em demonstrações matemáticas. Nos outros capítulos 
estudaremos os axiomas específicos da teoria dos conjuntos. 

Lembramos que é virtualmente impossível demonstrar teoremas complicados uti- 
lizando estritamente o rigor lógico apresentado aqui. Na prática, utilizamos os argu- 
mentos usuais que estamos acostumados em cursos como Análise Real ou Álgebra. 
Mas conhecer o processo formal de demonstração lógica nos dá uma base de sus- 
tentação, evitando as armadilhas da linguagem cotidiana. Isto é, devemos, em cada 
momento, tomar o cuidado de saber como formalizaríamos cada trecho de uma argu- 
mentação matemática, caso fosse necessário. 

Os três primeiros esquemas de axiomas são puramente proposicionais. Lem- 
bramos que utilizamos as abreviaturas apresentadas na seção anterior, para os conec- 
tivos A, V, e e o quantificador 3. 

Se 4, B, C são fórmulas, as seguintes fórmulas são axiomas: 


A1 (A) > ((B) > (4)); 
AZ (O) — (4) > (B)) > (UC) > (4) > ((C) — (B))); 
A3 ((4)) > (-(B))) > (B) > (4)). 


Os outros quatro esquemas de axiomas tratam da natureza dos quantificadores 
(ou melhor, do quantificador, já que reduzimos o quantificador existencial a abre- 
viatura). Nesses esquemas é preciso prestar atenção às regras quanto às variáveis 
livres (lembre-se da Seção 2.5) 


A4 (Yz((A) > (B))) > ((4) > (Yr(B))), se A e B são fórmulas, e z não possui 


ocorrência livre em 4; 
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A5 (Yz(A)) > (A!), se A é uma fórmula e x é uma variável que não ocorre livre no 
escopo de y, em 4; 


A6 zx = zx é um axioma, para qualquer variável x; 


AT (x = y) > ((4) > (B)), sempre que x,y são variáveis, 4 é uma fórmula, e B 
é obtido de A substituindo alguma ocorrência livre de x por uma ocorrência 
livre de y. 


As regras de inferência são duas: 


Modus Ponens: Se A e (4) > (B) são teoremas então B é teorema. 


Generalização: Se A é um teorema e x é uma variável, então Vx(A) é teorema. 


Agora que descrevemos os axiomas e regras de inferência, faremos alguns co- 
mentários e exemplos para esclarecer o sistema. 

Os três primeiros axiomas, juntamente com o Modus Ponens, são suficientes para 
provar todas as instâncias de tautologia >. Isto é, se pegarmos uma tautologia da 
lógica proposicional, e substituirmos cada proposição por uma fórmula de primeira 
ordem (devidamente cercado de parênteses, como mandam nossas regras de formação 
de fórmulas), a fórmula obtida é um teorema da lógica de primeira ordem, que pode 
ser deduzida a partir dos três primeiros axiomas e do Modus Ponens. Esse surpreen- 
dente resultado é conhecido como teorema da completude do cálculo proposicional. 
A verificação de que uma fórmula é uma instância de tautologia — construindo uma 
tabela-verdade — é bem mais simples que uma demonstração axiomática. 

O axioma 45 requer uma explicação especial. Primeiro, vejamos, como exemplo 
de aplicação, que (Vy(y € x)) — (z € x) é um axioma do esquema 45, pois sub- 
stituímos a variável livre y por z na fórmula y € x. Propositalmente utilizamos y 
no lugar de x e z no lugar de y, na forma como enunciamos o esquema de axiomas, 
para deixar claro que, na forma como está enunciada, x e y representam quaisquer 
variáveis. 

Se tomamos A como a fórmula (y € x) > Vy(y = x), precisamos tomar um certo 
cuidado na aplicação do esquema de axiomas 45. A fórmula A7 é (z € 1) > Yy(y = 
x). Ou seja, não substituímos a segunda ocorrência de y porque essa ocorrência não 
é livre. Esse detalhe na definição de AY (ou As, como queiram) é essencial. 

Por fim, outro cuidado que devemos tomar é com a última condição: a variável 
substituída não pode estar no escopo da variável nova. Vamos dar um exemplo de 
porque existe essa condição e, novamente, para não viciar o leitor com alguma ideia 
errada, vamos fazer a substituição da variável y por z, na aplicação de 45. Considere 
A a fórmula 3z~(y = z). Vamos utilizar o axioma 45 para a fórmula A e as variaveis 
y e z. Teremos o seguinte (já omitindo o excesso de parênteses): 


(Vydz(y = 2)) > (dza(z = 2)) 


3 Aqui, assumimos que o leitor está familiarizado com noções de lógica proposicional e tabela 
verdade. Se não estiver, isso não é absolutamente essencial para o curso, mas é aconselhável estudar 
um pouco sobre o assunto, especialmente para melhor compreender a lógica. 
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Ora, num sistema em que VydIz>(y = z) é um teorema (não é difícil um sistema 
assim, pois basta uma teoria em que existem dois objetos diferentes), por modus 
ponens e essa aplicação de 45 concluímos que 3z+(z = z), o que é um absurdo (por 
A6, regra da generalização e a definição de J, temos que a negação dessa fórmula 
é um teorema). Portanto, poderíamos ter uma inconsistência na lógica de primeira 
ordem se não declarássemos que essa substituição é proibida: y está no escopo de 
z, na fórmula 4, e, portanto, não podemos fazer essa substituição na aplicação do 
esquema 45. 

No esquema de axiomas A7 lembramos que a substituição pode ser feita em 
apenas uma ocorrência da variável livre, diferente dos axiomas A4 e A5, em que a 
substituição precisa ser feita em todas as ocorrências. 

Um exercício não trivial é mostrar que, se podemos fazer uma substituição, em 
AT, podemos fazer quantas quisermos. 

É bom observar que, no esquema 45, podemos escolher uma variável para sub- 
stituição que não ocorra em A. Dessa forma, como caso particular temos que, para 
toda fórmula 4, (Vx A) — A é um axioma. 


2.8 Notas sobre símbolos relacionais e funcionais 


Aqui nos limitamos a sistematizar apenas a linguagem da teoria dos conjuntos, que 
possui apenas um símbolo relacional (também chamado predicado), que é o símbolo 
€. Dizemos que é um símbolo relacional binário porque tem dois argumentos, isto 
é, relaciona dois termos. A rigor, a igualdade poderia ser considerado também um 
símbolo relacional binário, mas costuma entrar na lista dos símbolos obrigatórios da 
lógica de primeira ordem (mas isso depende da formalização que seguimos). 

Os símbolos relacionais correspondem ao verbo da linguagem cotidiana. Por ex- 
emplo, quando dizemos “o pai de João” não estamos enunciando nenhuma afirmação. 
A frase “o pai de João” não está passível a julgá-la como verdadeira ou falsa, pois 
apenas se refere a algum indivíduo, e nada diz sobre ele. Mas se dissermos “o pai de 
João conhece o pai de Joaquim”, então aí, sim, temos uma frase completa. O verbo 
conhecer relaciona duas pessoas, e, se soubermos quem são os indivíduos relacionados 
pelo verbo conhecer, seremos capazes de julgar se a frase é verdadeira ou falsa. 

“O pai de João” e “o pai de Joaquim” correspondem aos termos da lógica de 
primeira ordem, pois se referem a indivíduos do universo que estamos considerando. 
“João” e “Joaquim” seriam constantes, pois se referem a indivíduos específicos, 
diferentemente das variáveis (os pronomes, como ele, ela, alguém, correspondem às 
variáveis). A expressão “O pai de” é, na lógica, símbolos funcionais unários, pois 
representa uma função que associa a cada indivíduo do universo um outro indivíduo 
do mesmo universo. Assim, se criarmos uma lógica para formalizar relações entre 
pessoas, nosso universo será o conjunto de todas as pessoas, e “pai de” será uma 
função que associa a cada indivíduo um outro indivíduo. 

Observe que só é possível estabelecermos “pai de” como símbolo funcional porque 
cada pessoa possui um único pai biológico (ainda que não esteja mais vivo ou seja 
desconhecido). Se a clonagem vingar, já não poderemos tratar “pai de” como símbolo 
funcional. Da mesma forma, a expressão “o irmão de” não pode ser usada como 
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símbolo funcional, pois nem todas pessoas têm irmãos, e algumas têm mais que 
um irmão. A expressão “o irmão de” pressupõe que o indivíduo tem apenas um 
irmão, e, na lógica, só poderíamos usar algo semelhante se isso acontecesse a todos 
os indivíduos. Por outro lado, nada impede de considerarmos “é irmão de” como 
símbolo relacional binário, assim como “é pai de” como símbolo relacional binário. A 
formalização do “pai” permite escolhermos entre símbolo funcional e relacional, mas 
“irmão” necessariamente será um símbolo relacional. 

Na aritmética, há dois exemplos clássicos de símbolos funcionais binários: as 
operações + e x, que representam funções que associam a cada dois números um ter- 
ceiro. Também podemos considerar como constantes os números 0 e 1 (as constantes 
também podem ser vistas como símbolos funcionais O-ário, ou seja, sem parâmetro 
nenhum). Já a relação de ordem < é um símbolo relacional binário. 

A sucessiva aplicação de símbolos funcionais (como em 1 x (x +0), ou “a mãe do 
pai de Joaquim”) constrói termos cada vez mais complexos, e os símbolos relacionais 
(e a própria igualdade) passam a relacionar termos, e não apenas variáveis. Embora 
a preferência de notação, para símbolo funcional ou relacional binário, é colocar o 
símbolo no meio dos termos, se o grau desse símbolo for diferente de dois precisamos 
mudar a notação, e, para isso, acrescentamos, no alfabeto, a vírgula. A definição de 
termos passa a ser recursiva, semelhante a de fórmulas, conforme as regras: 


1. As variáveis são termos; 
2. As constantes são termos; 


3. Se ty,...,tn são termos e F é um símbolo funcional n-ário, então F(ty,...,tn) 
é um termo; 


4. Todos os termos têm uma das formas acima. 


Mudamos também a definição de fórmula atômica. Para as fórmulas mais com- 
plexas, continuam as regras anteriores. 


1. Se tı e t são termos, ty = t é uma fórmula; 


2. Sety,...,tn são termos e R é um símbolo relacional n-ário, então R(ty,...,tn) 
é uma fórmula. 


O sistema de axiomas muda, também, quando introduzimos símbolos funcionais. 
Por exemplo, no axioma A5 fazemos a substituição da variável x por um termo t, 
que não necessariamente é uma variável, e precisamos tomar cuidado para que x não 
esteja no escopo de nenhuma variável que ocorra em t. O axioma A6 passa a ser 
t = t, para todo termo t, e, no axioma AT, novamente substituímos as variáveis por 
termos. Também acrescentamos o seguinte axioma: 


(t= 8) = A A E A EA) = E eratkan rio 


para todo F símbolo funcional n-ário. 
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Se preferirmos, podemos dispensar o uso de símbolos funcionais no sistema, 
transformando-os em símbolos relacionais. Por exemplo, o símbolo de +, na ar- 
itmética, pode ser transformado num símbolo relacional ternário R(x,y,2z) que sig- 
nifica x -+y = z. Precisamos, porém, tomar mais cuidado na axiomatização específica. 

Embora na teoria dos conjuntos só contamos com um símbolo relacional, se es- 
tendermos a linguagem com as abreviaturas que utilizaremos ao longo da disciplina, 
podemos pensar em uma série de símbolos funcionais e constantes que utilizamos. 
Temos as constantes () (conjunto vazio), w (o conjunto dos números naturais, que 
será explicado posteriormente) etc. Dentre os símbolos funcionais unários adiciona- 
dos teremos P(X) (o conjunto dos subconjuntos de X), {x} (o conjunto que tem 
como único elemento o conjunto x), e assim por diante. A união e a intersecção de 
conjuntos podem ser vistos como símbolos funcionais binários, e a inclusão como um 
novo símbolo relacional binário. 


2.9 Notas sobre a semântica 


Para falarmos sobre a semântica da lógica de primeira ordem, a rigor precisaríamos 
primeiro desenvolver a teoria dos conjuntos. Porém, nesta seção apresentamos uma 
breve explicação da semântica, a partir da noção intuitiva de conjuntos que o leitor 


provavelmente adquiriu no ensino médio e nas outras disciplinas do curso de matemática. 


Mas, como prometemos anteriormente, essa parte não será necessária para aprender 
a teoria dos conjuntos axiomática, e nada impeça que o leitor só leie esta seção (ou 
retorne a ela) após o fim do livro (ou, pelo menos, após o capítulo 11). Não há, por- 
tanto, circularidade nessa apresentação. Mas entendermos um pouco da semântica 
ajuda a tornar mais intuitiva a sintaxe da lógica de primeira ordem. 

Seja £ uma linguagem de primeira ordem. Um modelo M para a linguagem £ é 
uma estrutura constituída das seguintes componentes: 


e Um conjunto não-vazio D, que chamaremos de domínio, ou universo, de M; 


Para cada símbolo relacional n-ário R uma relação RM em D (isto é, RM é um 
subconjunto de D”); 


Para cada constante c um elemento c™ de D; 


Para cada símbolo funcional n-ário F uma função FM de D” em D. 


Uma atribuição de variáveis é uma função o que associa a cada variável um 
elemento de D. 

Dados um modelo M e uma atribuição de variáveis o, a interpretação de termos 
sob a atribuição o é uma função o* que estende a função o a todos os termos, conforme 
as seguintes condições: 


e Sea é variável o*(x) = o(x); 


e Se F é um símbolo funcional n-ário e t1, . . . , tn são termos, então o*(F'(ty,...,tn)) 
FM(o* (ti), ., o (tn)). 
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Se M é um modelo, o é uma atribuição de variáveis e A é uma fórmula, denota- 
mos por (M,o) = A quando A é verdadeira no modelo M para uma atribuição de 
variáveis o, que definimos através das seguintes propriedades: 


e Para quaisquer termos tı e t2, (M,o) E tı = tz se, e somente se, o* (t1) = o*(ta); 


e Se R é um símbolo relacional n-ário e ty,...,tn são termos, então (M,o) E 
R(ty,...,tn) se, e somente se, (0*(ti),...,0*(tn)) E RM; 


(M,o) E —(4) se, e somente se, não ocorre (M, o) E 4; 


(M,o) E (A) > (B) se, e somente se, (M,o) = B ou não ocorre (M, o) E A; 


(M,o) E Vax(A) se, e somente se, para toda atribuição de variáveis 0 tal que 
9(y) = o(y), para toda variável y diferente de x, temos (M,0) E 4. 


Vamos dar um exemplo para entender melhor o significado de modelo. Considere 
a linguagem da aritmética, com dois símbolos funcionais binários + e x, as constantes 
0 e 1 e o símbolo relacional binário <. 

Podemos tomar a estrutura dos números naturais como modelo para a aritmética. 
Isto é, o domínio é o conjunto dos números naturais N, as constantes O e 1 são 
interpretadas pelos números correspondentes (isto é, 04 = 0 e 14 = 1, notando a 
diferença entre os símbolos 0 e 1 e os números 0 e 1). Os símbolos +, x e < também 
são interpretados pelas operações e relação correspondentes. 

Uma atribuição de variáveis o associa a cada variável um número natural. Por 
exemplo, imagine que o associa x ao número 1 e y ao número 2. Então o termo 
z +y é associado a 3, isto é, o*(x + y) = 1+2 = 3. De acordo com essa atribuição 
de variáveis, (M,0) E x < y. Agora, considere a fórmula Vy(z x y = y). Se 
modificarmos o apenas na variável y, teremos x x y = y verdadeiro no modelo M 
para essa nova atribuição de variável (pois 1 x y = y vale para qualquer y). 

Observe que, se A é uma sentença (isto é, não contém variáveis livres), a veraci- 
dade de A num modelo M não depende da atribuição de variáveis. Isto é, se tivermos 
(M, c) H A teremos (M,0) E A, para toda atribuição de variáveis 0. Quando isso 
acontece (A é verdadeira em M para qualquer atribuição de variável), denotamos 
M E A. Observe também que, quando A é uma sentença, ou M E A ou M = +A 
(esse é o princípio do terceiro excluído). 

Quando M E 4, também dizemos que o modelo M satisfaz a fórmula A. 


Consequência sintática e consequência semântica: Sejam £ uma linguagem 
de primeira ordem e T um conjunto de fórmulas de £L. Dizemos que uma fórmula A é 
consequência sintática de T (que denotaremos por F F A) se existe uma demonstração 
de A a partir das fórmulas de I (isto é, se incluirmos as fórmulas pertencentes a I 
entre os axiomas da lógica de primeira ordem, podemos provar 4). Dizemos que 
uma fórmula A é consequência semântica de I (que denotaremos por T E A) se todo 
modelo que satisfaz todas as fórmulas em T também satisfaz 4. 
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Teoremas fundamentais: Os três principais teoremas metamatemáticos a re- 
speito da lógica de primeira ordem são os teoremas da completude, da compacidade 
e de Loweinhein-Skolen. 

O teorema da completude diz que F F A se, e somente se, I H A. Ou seja, con- 
sequência sintática é equivalente a consequência semântica, provando que o sistema 
de axiomas que construímos é suficiente para provar tudo que podemos provar pelos 
argumentos usuais da linguagem cotidiana. 

O teorema da compacidade diz que, se para todo I” subconjunto finito de T existe 
um modelo que satisfaz todas as fórmulas de T’, então existe um modelo que satisfaz 
todas as fórmulas de r. 

O teorema de Loweinhein-Skolen pode ser enunciado da seguinte maneira: se 
existe um modelo que satisfaça todas as fórmulas de um conjunto T, então, para 
qualquer conjunto infinito X, existe um modelo cujo domínio é X e que também 
satisfaz I’. Em geral, as linguagens de lógica de primeira ordem que utilizamos têm 
uma quantidade enumerável de símbolos. Senão, precisamos assumir que X tem 
cardinalidade maior ou igual à cardinalidade do alfabeto. Uma versão do teorema 
diz que todo modelo possui um modelo equivalente (isto é, ambos possuem as mesmas 
fórmulas como verdadeiras) cujo domínio é enumerável. 


Exercícios 


1. Usando a linguagem de primeira ordem da teoria dos conjuntos, escreva fórmulas 
para representar as seguintes frases: 


a) Não existe conjunto de todos os conjuntos. 

b) Existe um único conjunto vazio. 

c) x é um conjunto unitário. 

d) Existe um conjunto que tem como elemento apenas o conjunto vazio. 


e) y é o conjunto dos subconjuntos de q. 


2. Marque as ocorrências livres de variáveis nas fórmulas abaixo. 


a) (Vz(z = y)) > (z € y) 
b) Vz((z = y) > (x € y)) 


c) Vala = x) > (Yydz(((z = y) A (y = 2)) > «(x € y))) 


d) Vray(>(x = y) A Yz((z € y) = Yw((w E z) > (w € x)))) 


e) (x = y) > dy(r = y) 
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3. Na linguagem da aritmética dos números naturais (com os símbolos funcionais + 
e x e as constantes 0 e 1) escreva as fórmulas de primeira ordem que correspondem 
às frases abaixo. 


a) x é número primo. 
b) x é menor do que y. 
c) A soma de dois números ímpares é par. 
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d) A equação r? + y? = 2? não tem soluções inteiras positivas. 


e) Todo número par maior do que dois pode ser escrito como soma de dois números 
primos. 


4. Julgue se cada uma das fórmulas abaixo é verdadeira em cada um dos seguintes 
modelos: N, Z, Q, R. 


a) VaVyexistsz(x +y = 2) 


b) VaVy(>(y = 0) > existsz(x x y = 2)) 


c) Selo x e=11) 


5. E possível uma axiomatização de primeira ordem para os números reais? Justi- 
fique, tentando descobrir o que significa uma “lógica de segunda ordem”. 


Capítulo 3 


Axiomas da extensão e do vazio 


Há três tipos de axiomas no sistema de Zermelo-Frankel. Alguns axiomas — o ax- 
ioma do vazio e o axioma da infinidade — garantem a existência de conjuntos bem 
específicos. Outros axiomas — do par, da união, das partes, da escolha, da separação 
e da substituição — nos permite construir conjuntos a partir de outros. Há outros 
dois axiomas — da extensão e da regularidade — que nos dizem a respeito da natureza 
dos conjuntos, ajudando-nos a entender o seu significado. Vamos começar falando do 
axioma da extensão, que praticamente nos dá uma definição de conjuntos. 


Axioma 1 (da extensão) Dois conjuntos são iguais se, e somente se, eles têm os 
mesmos elementos. 


vzvy((x = y) > (Vz(z E £ oz € y)) 


Há essencialmente duas maneiras de representar um conjunto: descrevendo os el- 
ementos do conjunto através de uma propriedade comum a todos eles ou descrevendo 
cada elemento, entre chaves e separados por vírgulas. Por exemplo, numa abordagem 
informal, considere os seguintes “conjuntos” : 


{Uruguai, Itália, Alemanha, Brasil, Inglaterra, Argentina, França, Es- 
panha} 


Conjunto dos países que já venceram alguma Copa do Mundo de fute- 


bol 


Ambos os conjuntos possuem os mesmos elementos. Cada elemento do primeiro 
conjunto também é um elemento do segundo, e vice-versa. Logo, os dois conjuntos 
são iguais, isto é, são o mesmo conjunto. 

Considere agora o seguinte conjunto: 


{Alemanha, Argentina, Brasil, Espanha, França, Inglaterra, Itália, 
Uruguai, Brasil} 
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O axioma da extensão nos garante que esse conjunto é o mesmo que o anterior. 
Ou seja, vale aquela máxima que aprendemos no ensino básico: em um conjunto não 
importa a ordem dos elementos nem contamos as repetições. 

Agora enunciemos um dos axiomas que garante a existência de certo tipo de 
conjunto. 


Axioma 2 (do vazio) Existe um conjunto vazio. 


JaVyo(y E x) 


Introduzimos uma outra definição: É significa não pertence. Ou seja, x É y é 
abreviatura para —(x € y). Assim, o axioma do vazio pode ser reescrito como 


JaVyly É x) 


Na verdade, o axioma do vazio é dispensável, pois veremos que ele pode ser 
provado a partir do axioma da separação, desde que assumamos que existe pelo menos 
um conjunto. Assim,podemos reescrever o axioma do vazio como existe um conjunto | 

O primeiro teorema que apresentamos, onde aplicamos diretamente o axioma da 
extensão, é a unicidade do conjunto vazio. 


Teorema 3.1 Existe um único conjunto vazio. 


Demonstração: A existência de um conjunto vazio é ditada pelo axioma do vazio. 
Mostremos a unicidade. Suponhamos que existem x e y conjuntos vazios diferentes. 
Pelo axioma da extensão, existe um elemento de x que não pertence a y ou existe um 
elemento de y que não pertence a x, o que, em ambos os casos, contradiz que x e y 
são vazios. E 

Como o conjunto vazio é único, podemos adicionar uma constante na linguagem 
que o represente. O símbolo adotado para o conjunto vazio é (). 

Vamos agora definir a relação de inclusão. 


Definição 3.2 Dizemos que um conjunto x está contido em y (e denotamos por 
x C y) se todo elemento de x é um elemento de z. Isto é 


(x Cy) VYz((zE€xz)—>(z€y)). 


Quando x C y, também dizemos que x é um subconjunto de y. 
Através dessa definição, o axioma da extensão pode ser escrito como 


(r=)o((vcy)n(yca) 
O mesmo argumento do teorema anterior prova o seguinte: 


Teorema 3.3 O conjunto vazio está contido em qualquer conjunto. 


Vr( C x) 


lNa verdade, a formulação que aqui apresentamos da lógica de primeira ordem não permite que 
o domínio (vide a seção sobre semântica) seja vazio. Logo, a rigor, o axioma do vazio — ou da 
existência de conjuntos — é dispensável. Porém, mantemos esse axioma por motivos históricos e 
didáticos. 
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Demonstração: Suponha que existe um x tal que À não está contido em x. Logo, 
existe y pertencente a () que não pertence a x, contradizendo a definição do conjunto 
vazio. E 

Esse tipo de argumento — conhecido como argumento da vacuidade — é bastante 
estranho na linguagem cotidiana mas muito comum na matemática e na lógica. Se 
eu disser “toda vez que eu fui para Marte encontrei homenzinhos verdes” essa frase é 
logicamente correta, visto que eu nunca fui para Marte. 

Uma coisa que precisamos falar sobre as relações de pertinência e inclusão é sobre 
um mito clássico divulgado nas escolas de ensino fundamental e médio. Dizem alguns 
que pertence se usa entre elemento e conjunto e contido se usa entre conjuntos. Esse é 
um erro grave, que pode causar um vício de aprendizagem que precisa ser derrubado. 

O primeiro erro dessa frase é ignorar que existem conjuntos de conjuntos. Isto 
é, como, a princípio (na teoria ingênua dos conjuntos), podemos formar conjuntos 
de qualquer tipo de objeto, nada impede que os próprios elementos dos conjuntos 
sejam conjuntos. Por exemplo, {0} é um conjunto (assumindo que existe, pois ainda 
não provamos isso), cujo único elemento é o conjunto vazio. Isto é, podemos afirmar 
tranquilamente que Ø € {Ø}, não obstante também valha (como acabamos de mostrar) 
Ø c {0}. Aliás, lembremos que, na teoria dos conjuntos, tudo é conjunto, e, portanto, 
todos elementos de um conjunto são também conjuntos. Por isso definimos o símbolo 
E€ como uma relação entre conjuntos, contrariando totalmente o mito divulgado nas 
escolas. 

O segundo crime desse mito é desvirtuar a real compreensão dos dois símbolos. 
A frase — destinada a ajudar os alunos a acertarem algumas questões mesmo sem 
compreendê-las de fato — insinua que a pertinência e a inclusão são ambos símbolos 
primitivos com significados parecidos, como se essa “regrinha” fosse a única maneira 
de diferenciarmos os dois símbolos. Ora, na verdade, o símbolo primitivo é o de 
pertinência, e a inclusão foi definida logicamente a partir desse. Um conjunto «x está 
contido em y se cada elemento de x também é um elemento de y. 

Para ajudar o leitor a superar eventuais vícios de aprendizagem, preparamos 
uma listinha de exercícios sobre o uso correto desses símbolos. Os exercícios de cada 
capítulo são poucos e não muito difíceis. É altamente recomendável que o estudante 
os faça. 

A última observação deixada neste capítulo é a seguinte: até agora, tendo em 
mãos apenas os axiomas da extensão e do vazio, não podemos garantir a existência de 
qualquer outro conjunto senão o conjunto vazio. Os outros axiomas serão necessários 
para construirmos toda a teoria dos conjuntos a partir do “nada”. 


Exercícios 


Para esses exercícios, assumimos que os conjuntos enunciados existem. 
1. Usando o axioma da extensão, prove que Ø e {Ø} são conjuntos diferentes. 


2. Para cada par de conjuntos abaixo, decida qual(is) dos símbolos € e C tornam 
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os símbolos 
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ou nenhum deles. Justifique cada resposta. 


a) {0}... 10,10) 

b) {0}... {0} 

c) {1,2,3}... {{1} {2} {3}} 

d) {1,2,3}... {{1}, {1,2}, {1,2,3} 

e) {1,2}... {1, {1}, 2, {12}, {13} 

f£) {{1} RH... {{1,2}} 

3. Seja x o conjunto {0, {0}, Ø, 10, {0}}} 

a) Quantos elementos tem o conjunto z? 

b) Descreva todos os subconjuntos de x 

c) Descreva, utilizando chaves e vírgula, o conjunto de todos os subconjuntos de z. 


d) Quantos elementos o conjunto dos subconjuntos de x possui? 
4. Prove que x C zx, para todo zx. 


5. Prove que z € y se, e somente se, {x£} C y. 


Capítulo 4 


Axiomas do par, da união e das 
partes 


Conforme vimos no final do capítulo anterior, tendo apenas o axioma da extensão e 
o axioma do vazio não podemos garantir a existência de nenhum conjunto além do 
próprio conjunto vazio. Precisamos de outros axiomas que permitem construirmos 
outros conjuntos a partir do que já temos. O primeiro deles é o axioma do par. 


Axioma 3 (do par) Para todos conjuntos x e y existe um conjunto cujos elementos 
são T ey. 


VrYy3zVw((w € z) = ((w = x) V (w = y)) 


Mantendo a notação do capítulo anterior, o axioma do par nos diz que para todos 
x e y existe o conjunto (x,y). Note que trata-se de um par não-ordenado, isto é, 
conforme o axioma da extensão, a ordem dos elementos não importa. O conjunto 
(x,y) é o mesmo que o conjunto {y, x). Note também que x e y não precisam ser 
distintos. No caso de x ser igual a y, o conjunto {x,y} é igual a {x} (aplicando-se o 
axioma da extensão). 

Por exemplo, tomando ambos x e y iguais a (), o axioma do par nos garante 
a existência do conjunto ((),()!, que, pelo axioma da extensão, é igual ao conjunto 
{emptyset}. 

Já vimos no capítulo anterior que Ø e {Ø} são conjuntos diferentes, e, agora, con- 
seguimos provar a existência desse segundo conjunto. Ou seja, até agora já provamos 
que existem pelo menos dois conjuntos distintos! 

Aplicações sucessivas do axioma do par nos fornece uma infinidade de conjuntos 
(finitos). Podemos provar a existência de {0, (0H), {1{0}}, {{{0}}} e assim por diante. 

Enunciemos o próximo axioma, que também pertence ao grupo de axiomas de 
construção. 


Axioma 4 (da união) Para todo conjunto x existe o conjunto de todos os conjuntos 
que pertencem a algum elemento de zx. 


Velyvul(w € y) = w((w E€ v) A (v € x))) 
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Repare que o axioma da união não garante, a princípio, a união de dois conjuntos, 
mas, sim, a união de uma famila de conjuntos. Se pensarmos em um conjunto 
de conjuntos como uma caixa cheia de pacotes menores, a união desse conjunto 
de conjuntos corresponde a despejarmos todo o conteúdo dos pacotes menores na 
caixa maior. Vejamos, como exemplo (assumindo que existe — visto que ainda nem 
explicamos o que são os números naturais), o seguinte conjunto: 


{{1,2}, {1,3}, {4}} 


A união do conjunto acima é o conjunto formado por todos os números que pertencem 
a pelo menos um de seus elementos, a saber: 


{1,2,3,4} 


Em outras palavras, a união de x é o conjunto dos elementos dos elementos de 
£T. 

Denotamos a união de um conjunto x por [Jx. Convém ressaltar — e isso vale 
também para o axioma do par — que o axioma da extensão garante que a união é 
única. Isto é, dado qualquer conjunto x, não existem dois conjuntos diferentes que, no 
lugar de y, tornariam a sentença correspondente ao axioma da união verdadeira. O 
axioma da união determina unicamente um conjunto a partir de x. O artigo definido 
o que consta no enunciado do axioma, em linguagem natural, está bem colocado. 

Deixamos ao leitor a tarefa de mostrar as seguintes igualdades: 


U= 

UtO) = 0 

UKO, {103} = {0} 
UiO 40 


Com o axioma do par e o axioma da união em mãos podemos definir a união de 
dois conjuntos. 


Teorema 4.1 Dados dois conjuntos x e y existe o conjunto formado por todos os 
conjuntos que pertencem a x ou ay. 


VaVyaNw((wv € z) o ((w € x) V (w € y))) 


Demonstração: Dados dois conjuntos x e y, aplicamos o axioma do para para 
obtermos o conjunto {x,y}. Aplicando o axioma da união sobre o conjunto {x,y} 
obtemos o conjunto z = [J(x,y). Observe, pela definição da união de uma famíla de 
conjuntos, que, para todo w, w E z se, e somente se, existe u E€ (x,y! tal que w € u. 
Mas, se u € (x,y), temos que u = w ou u = y, provando que z satisfaz o enunciado 
do teorema. E 


Novamente notamos que a união de dois conjuntos é única, pelo axioma da ex- 
tensão, o que nos permite introduzir a seguinte definição. 
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Definição 4.2 Definimos a união de x e y como o conjunto formado por todos os 
conjuntos que pertencem a x ou a y, e denotaremos esse conjunto por x U y. 


O último axioma deste capítulo traz novamente à tona a ideia de conjunto de 
conjuntos, e a necessidade de não confundirmos os símbolos de pertinência e inclusão. 


Axioma 5 (das partes) Para todo conjunto x eriste o conjunto dos subconjuntos 
de 2. 


VrJyyz((z € y) o (z C x)) 


Se quizermos transformar a fórmula acima sem usar o símbolo de inclusão, basta 
escolhermos uma variável nova que não consta na fórmula (w, por exemplo) e substi- 
tuirmos z C x pela fórmula Yw((w € 2) > (w € x)). É importante que o leitor esteja 
familiarizado com essas abreviaturas e com o processo de converter essas abreviaturas 
pela fórmula completa. 

O conjunto definido pelo axioma das partes também é único. Introduzimos a 
seguinte definição: 


Definição 4.3 Definimos o conjunto das partes de x como o conjunto dos subcon- 
juntos de x, e denotaremos por P(x). 


Exercícios 


1. Escreva uma fórmula de primeira ordem, na linguagem da teoria dos conjuntos, 
com quatro variáveis livres, que represente o conjunto {x,y,z}. 


2. Escreva o conjunto (10,1), {{1}}, {1,2}, {{1,2}}} listando seus elementos en- 
tre chaves. 


3. Escreva o conjunto P({0, (0H). 
4. Prove que J'P(x) = z. 


5. Prove que, se x C y, então Jaz C (y. 
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CAPÍTULO 4. AXIOMAS DO PAR, DA UNIÃO E DAS PARTES 


Capítulo 5 


Axioma da separação — Paradoxo 
de Russell 


O axioma da separação de certa forma resgata a concepção inicial de Frege de definir 
um conjunto através de uma fórmula lógica que descreve seus elementos. Mas, para 
evitar o paradoxo de Russell, na formulação do axioma da separação é necessário 
estabelecer um conjunto do qual iremos “separar” os elementos que satisfazem uma 
determinada propriedade. 

Assim, para cada fórmula P(x), temos que, para todo conjunto y, existe o con- 
junto formado por todos x € y tais que P(x) é verdadeiro. 

Formalmente, o axioma da separação é um esquema de axiomas, isto é, uma lista 
infinita de axiomas, conforme abaixo: 


Axioma 6 (Esquema de axiomas da separação) Para cada fórmula P tal que 
z em que z não ocorre livre a seguinte fórmula é um axioma: 


Vyava((lres) o ((x € y) A P)) 
O conjunto z, como no axioma, será denotado por 


{z € y : P(x)) 


Notemos que a única restrição sobre a fórmula P é não conter z como variável 
livre. Essa restrição é necessária porque utilizamos essa variável no axioma para 
definir o conjunto {x € y : P(x)}. Se permitirmos que a mesma variável que define 
o conjunto dado pelo axioma da separação também ocorra livre em P, poderíamos 
tomar P como a fórmula x É z e teríamos a seguinte instância do axioma da sep- 
aração: 


VyIN alta E 2) > ((x ey) A (x é 2))) 


Se tomássemos, por exemplo, y = {0} e x = Ø, teríamos x € y verdadeiro e, 
portanto, teríamos 
(1 E 2) 6 (x g 2) 


o que é uma contradição. 
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Não precisamos impor qualquer outra restrição sobre as variáveis livres em P. 
Em todas as aplicações do axioma da separação, a variável x ocorre livre em P (por 
isso utilizamos a notação P(x) para a fórmula P). Mas se x não ocorrer livre em 
P, isso não causará inconsistência no sistema. Apenas a aplicação do axioma da 
separação seria trivial, pois o conjunto z seria vazio ou o próprio y (já que a validade 
de P, nesse caso, não depende da variável x, que não ocorre livre em P). 

Podemos ter outras variáveis livres em P além de x. Isso ocorre, por exemplo, 
na definição de intersecção de conjuntos: 


aNnb=(zrea:zeb) 


A própria variável y (que reservamos para o — digamos — “conjunto universo”) 
pode ocorrer livre em P, como na seguinte definição: 


(rey:zcy 
Com essa formulação do sistema de Zermelo-Fraenkel o Paradoxo de Russell 
ganha um novo significado, conforme o teorema seguinte. 


Teorema 5.1 (Paradoxo de Russell) Não existe conjunto de todos os conjuntos. 
Vrdy(y É z) 


Demonstração: Suponha que exista um conjunto y tal que, para todo x, x € y. 
Pelo axioma da separação para a fórmula x ¢ x, existe z tal que, para todo x, 
(x E€ z) = ((x E€ y) A (x € x)) 

Como x € y é verdadeiro para todo x temos que 

(x E€ z) = (x £ x)) 
Tomando z no lugar de x temos 

(zez) = (zé 2) 
chegando numa contradição. H 

O axioma do vazio segue como consequência do axioma da separação, pois, pelos 

axiomas lógicos podemos provar a sentença Jy(y = y) (ou seja, a formulação lógica 


aqui apresentada garante que existe algum conjunto). Usemos o axioma da separação 
para esse y e para a fórmula x £ x. Obtemos o conjunto 


treyizÃa), 


que é o conjunto vazio. 
A partir do axioma da separação podemos definir as operações conjuntísticas. 
Comecemos pela intersecção de uma família de conjuntos. 


Teorema 5.2 (Intersecção de uma família de conjuntos) Dado um conjunto não 


vazio x existe o conjunto formado por todos os conjuntos que pertencem simultanea- 
mente a todos os elementos de x. 


Vi(Iy(y € q) > Jy(Yz((z € y) => Yw((w € z) > (z € w))))) 


Denotaremos esse conjunto por (Nx. 
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Demonstração: Seja z um elemento de x. Defina o conjunto y como 
{v € z : Vw((w E x) > w € w))} 


O axioma da separação garante a existência do conjunto y. Agora verifiquemos que 
y satisfaz as condições do teorema. Seja v € y. Pela definição de y, para todo w € x 
temos v € w. Reciprocamente, se para todo w € x temos v € w, então, em particular, 
v E€ z e, portanto, v € y. Isso prova que, para todo v, v € y se, e somente se, v E Ww, 
para todo w € x. 
E 

É bom notar que, diferente da união de uma família de conjuntos, na inter- 
secção precisamos impor a restrição de que a família é não-vazia. A união de uma 
família vazia é o conjunto vazio. Mas se fizéssemos a intesecção de uma família vazia 
obteríamos o “conjunto de todos os conjuntos”, já que todo conjunto x satisfaz, por 
vacuidade, a condição “para todo y pertencente ao conjunto vazio x € y”. 

Agora aplicaremos o axioma da separação para definir diversas operações binárias 
entre conjuntos. À saber, são elas: 


Intersecção: «Ny= (ze x:zEey) 
Subtração: «x y=(zex:zéy) 
Diferença simétrica: r^y = (ze xUy:zgaNyb 

Quando x N y = (), dizemos que x e y são disjuntos. 

A intersecção de conjuntos está relacionado ao operador booleano e, pois per- 
tencer a x Ny significa pertencer a z e a y. A união significa ou, pois pertencer 
a x U y seginifica pertencer a x ou pertencer a x. A diferença simétrica é ou ou 
exclusivo (pertencer a x ou a y, mas não a ambos). A união de uma família de 
conjuntos está relacionada ao quantificador existencial, pois pertencer a |] x significa 
pertencer a algum elemento de x, enquanto a intersecção de uma família de conju- 


tos representa o quantificador universal, porque pertencer a [x significa pertencer a 
todos os elementos de x. 


Exercícios 


1. Prove que não existe o conjunto de todos os conjuntos unitários. 
Dica: Assuma, por absurdo, a existência do conjunto de todos os conjuntos 
unitários e prove a existência do conjunto de todos os conjuntos. 


2. Prove que, para todo conjunto X existe o conjunto 
Tri s e X} 
3. Sendo z um conjunto não vazio, prove que 


Yyly € £ > (cy) 
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4. Sendo x um conjunto não vazio, prove que 
TC uy — N yY C N x 


5. Escreva na linguagem da lógica de primeira ordem, sem abreviaturas, a seguinte 


fórmula: 
zE UNu (wx z)) 


Capítulo 6 


Axioma da regularidade 


Até agora, todos os axiomas que vimos garantem a construção de alguns conjuntos 
partindo apenas do conjunto vazio. O próximo axioma garante que todos os conjuntos 
são construídos a partir do vazio. Também irá evitar coisas como x € x e será útil 
em teoria dos modelos para fazermos indução sobre a relação de pertinência. 


Axioma 7 (da regularidade) Para todo conjunto x não-vazio existe y E x tal que 
ig 


Velr #0 > Jyly Ex ^AzNy = 0) 


Teorema 6.1 Não existem x e y tais quer Eyeyez. 


Demonstração: Sejam x e y conjuntos quaisquer. Vamos provar que z É y ou 

Usando o axioma do par, tome z = {x,y}. Como z não é vazio, pelo axioma da 
regularidade existe w € z tal que wN z = Ø. Se w = x, isso implica que y É x. Se 
w = y, isso implica que x É y, provando o teorema. E 


Corolário 6.2 Não existe x tal que x € x. 


Demonstração: Aplique o teorema anterior para x = y. E 

O axioma da regularidade garante que não existe uma sequência infinita de- 
crescente na relação de pertinência. Ou seja, não existe uma sequência da forma 
...£3 E £3 E 14 E€ £o. Para se ter uma ideia da demonstração desse fato, supondo, 
por absurdo, que existem tais conjuntos, considere x = (x0,%1,%2,...+. Para qual- 
quer £n E x temos %,41 E Zn Nx, contradizendo o axioma da regularidade. 

O problema dessa demonstração está na formalização da ideia de sequência, já 
que ainda não definimos o conjunto dos números naturais nem funções. No momento 
oportuno apresentaremos esse resultado como exercício. 

Concluímos desse resultado que, para qualquer conjunto x, se tomarmos um 
elemento de x, e um elemento de um elemento de x, e um elemento de um elemento 
de um elemento de x, assim sucessivamente, chegaremos, após uma quantidade finita 
de passos, no conjunto vazio. 
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É bom notar que se, por um lado, não existe uma sequência infinita decrescente, 
na relação de pertinência, por outro lado, como veremos no próximo capítulo, é 
possível existir uma sequência infinita crescente. Ou seja, sequências infinitas da 
forma zo € 71 E€ £2... existem (os números naturais, por exemplo). 


Exercícios 


1. Usando o axioma da regularidade, prove que não existem x,y,z tais que x € y, 
yvezezez. 


2. Usando o axioma da regularidade, prove que não existem w, x,y, z tais que w € x, 
vEy,yEZeZEU. 


3. Dizemos que um conjunto x é transitivo se todo elemento de x está contido em 
x. Use o axioma da regularidade para provar que, para todo conjunto transitivo x, 
se x £ () então DE x. 


4. Prove que não existe x tal que P(x) = x. 


5. Prove que existe um modelo para teoria dos conjuntos em que valem os axiomas 
do par, da união e das partes, mas não valem os axiomas do vazio e da regularidade. 
Dica: Considere um modelo formado por um único elemento x tal que x € x. 


Capítulo 7 


Axioma da infinidade — números 
naturais 


O axioma da infinidade é, ao lado do vazio, um axioma que garante a existência 
de um conjunto específico. No caso, de um conjunto infinito. Há várias formas de 
apresentar o axioma da infinidade. Uma delas enuncia a existência do conjunto dos 
números naturais, conforme a concepção de von Neuman. Outra forma, utilizada 
aqui, é enunciar a existência de um conjunto do qual deduzimos a existência (e 
definimos) do conjunto dos números naturais. A terceira simplesmente enuncia a 
existência de um conjunto infinito (embora ainda não tenhamos definido o que é 
um conjunto infinito), e a construção do conjunto dos números naturais torna-se um 
pouco mais complicada e utiliza o axioma da substituição, semelhante ao que será 
feito na construção dos ordinais. 

Na definição dos números naturais atribuída a von Neumann, pensamos em um 
número natural como o conjunto dos números naturais menores que ele. Assim, o 0 
é o conjunto dos números naturais menores que 0. Como não existe número natural 
menor que 0, então 0 será representado pelo conjunto vazio. O número 1 é o conjunto 
formado pelos números menores que 1. Ou seja, 1 é o conjunto {0}, que é igual a 
{0}.. O número 2 é o conjunto {0, 1}, ou seja, o conjunto {0, {0} }, e assim por diante. 

Note que o número 3, que é o conjunto (0, 1,2}, pode ser escrito como (0, 1}U{2}, 
assim como 1 = Ø U {0} e 2 = {0} U {1}. Ou seja, o sucessor de um número natural 
n é o resultado de acrescentarmos o próprio n ao conjunto n. Isto é, n+1=nU{n}. 
Isso justifica a seguinte definição de sucessor: 


Definição 7.1 Dado um conjunto x, definimos x? como x U {æ}. Isto é, 
Vyly E 1+ o (gervy=a)) 


Quando um conjunto possui o vazio como elemento, e é fechado pela operação de 
sucessor, então dizemos que tal conjunto é indutivo, conforme segue a definição. 


Definição 7.2 Dizemos que um conjunto x é indutivo se, e somente se, À € x e, para 
todo y, se y € zx então y% € 7. 


O axioma da infinidade nada mais diz que a existência de algum conjunto indu- 
tivo. 
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Axioma 8 (da infinidade) Existe um conjunto indutivo. 


Ja(W)esvylyer>yt es) 


Note que um conjunto indutivo precisa possuir o vazio e todos os sucessores 
obtidos a partir do vazio. Ou seja, um conjunto indutivo precisa conter o conjunto 
dos números naturais (conforme será provado no teorema ??, parte (b)), mas pode 
ter elementos a mais. Usando o teorema 5.2 e os axiomas da separação, das partes e 
da infinidade, definimos o conjunto dos números naturais da seguinte forma: 


Definição 7.3 Definimos o conjunto dos números naturais — que será denotado por 
w — como o seguinte conjunto: 


w = (Ma € P(T) : x é indutivo) 
onde 1 é o conjunto indutivo determinado pelo axioma da infinidade. 


Notemos que a intersecção é permitida porque a família de subconjunts de T 
que são indutivos não é vazia, dado que pelo menos o próprio conjunto 1 é indutivo. 
Agora, resta-nos mostrar que o próprio conjunto w é indutivo, e que segue da definição 
que ele é o menor conjunto indutivo que existe. Fica como exercício provar — a partir 
do teorema seguinte — que a definição de w não depende da escolha de T. 


Teorema 7.4 (a) w é um conjunto indutivo. 


(b) Se A é um conjunto indutivo então w C A. 


Demonstração: Seja 1 o conjunto indutivo dado pelo axioma da infinidade. Vamos 
provar que w é indutivo. Primeiro, provemos que À) € w. De fato, se A é um 
subconjunto de 1 que é indutivo, então Ø € A. Logo Ú pertence à intersecção de 
todos os subconjuntos indutivos de 7. Agora, suponha que x € w. Isso significa que 
x € À, para todo A suconjunto indutivo de I. Mas isso implica que x? € A, para 
todo A C T indutivo. Logo, «* € A, provando a parte (a) do teorema. 

Agora provemos a parte (b). Seja A um conjunto indutivo. Repetindo o argu- 
mento do parágrafo anterior, concluímos que ANT é indutivo. Como ANT C I, 
temos, pela definição de w, que todo elemento de w também pertence a ANT. Ou 
seja, w C AN T e, portanto, w C A. E 


Observe que segue da demonstração do Teorema 7.4, que a definição de w inde- 
pende da escolha do conjunto indutivo T. Para verificarmos isso, tome J qualquer 
outro conjunto indutivo e defina A = {x e P(J) : J é indutivo}. A demonstração 
do Teorema 7.4 pode ser aplicada para A, no lugar de w, e concluímos que A é indu- 
tivo e, pelo item (b) (aplicado duas vezes) temos que A C w ew C A. O teorema da 
extensão nos garante, então, que A = w. 


Agora verificaremos por que convém chamarmos w de “conjunto dos números 
naturais”. Primeiro, vamos enunciar os axiomas de Peano, sobre números naturais. 
Adotamos como conceitos primitivos zero e sucessor de. São esses os axiomas: 
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1. Zero é um número natural. 

2. O sucessor de um número natural é um número natural. 
3. Números naturais distintos nunca têm o mesmo sucessor. 
4. Zero não é sucessor de qualquer número natural. 


5. Se uma propriedade vale para zero e, valendo para um dado número natural, 
também vale para o seu sucessor imediato, então valerá para todos os números 
naturais. 


O quinto axioma de Peano é o que conhecemos como princípio da indução finita. 

Uma formalização precisa dos axiomas de Peano, usando lógica de primeira or- 
dem, é a seguinte: introduzimos 0 (zero) como uma constante e s (sucessor de) 
como um símbolo funcional unário da linguagem. O primeiro e o segundo ax- 
ioma tornam-se desnecessários. O terceiro e o quarto axioma são respectivamente 
VaVyla(ao = y) > —(s(x) = s(y))) e Yz(~(s(x) = 0)). O quinto axioma torna-se um 
esquema de axiomas, em que, para cada fórmula P, a fórmula 


(POA Va(P > PSD) > vzP 


é um axioma. 
O próximo teorema diz que o conjunto w serve como domínio de um modelo para 
os axiomas de Peano, interpretando 0 como () e s(n) como nt. 


Teorema 7.5 O conjunto w satisfaz os axiomas de Peano, identificando “zero” com 
o conjunto vazio e o sucessor de x com £7. 


Demonstração: Os dois primeiros axiomas seguem do fato de w ser indutivo. Para 
provarmos o terceiro axioma, suponhamos, por absurdo, que x Æ y e t? = y7. 
Temos que x € x”, logo, pela hipótese, x € yt. Como y™ = y U y, e x Æ y, então 
xz € y. Analogamente provamos que y € x, contradizendo o axioma da regulari- 
dade !(Teorema 6.1). 

O quarto axioma segue do fato que x € x”, logo, não podemos ter, para nenhum 
xz, rt =Í. 

Para provarmos o princípio da indução finita, seja P uma fórmula tal que P’ e 
Va(P — pe são verdadeiros. Usando o axioma da separação, considere 4 o conjunto 
{xz €w: P}. Pela hipótese sobre P é fácil verificar que A é indutivo. Logo, pelo 
Teorema 7.4, parte (b), temos que w C A, provando que todo elemento de w satisfaz 
P. E 


!Na verdade, o uso do axioma da regularidade facilita a demonstração, mas não é necessário, 
uma vez que o conjunto w e seus elementos satisfazem o axioma da regularidade, sem precisarmos 
assumi-lo. Voltaremos nesse assunto quando falarmos sobre números ordinais. 
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Exercícios: 


1. Prove, a partir dos axiomas de Peano, os seguintes teoremas: 
(a) Todo número natural é diferente do seu sucessor. 


(b) Zero é o único número natural que não é sucessor de algum número natural. 
2. Prove que w é um conjunto transitivo, isto é, se x E€ w então x C w. 
3. Prove que, para todo n E w, )enouh=n. 


4. A união de dois conjuntos indutivos é necessariamente um conjunto indutivo? 
Justifique sua resposta. 


5. Prove que, para todos n,m E w, sem E n então n C m. 


Capítulo 8 


Produto cartesiano e relações 


As definições neste e no próximo capítulo são fundamentais para enunciarmos o 
axioma da escolha. Começamos definindo pares ordenados, produto cartesiano e 
relações. 


8.1 Pares ordenados 


O axioma do par nos garante construirmos, a partir de dois conjuntos a e b, o par 
{a,b}. Porém, nessa definição de par a ordem dos elementos não importa, de modo 
que {a,b} = {b,a}. Na definição de par ordenado, a igualdade só vale quando a 
ordem é a mesma. 


Definição 8.1 Dados dois conjuntos a e b, definimos o par ordenado (a,b) como o 
conjunto (fa), {a,b}}. Ou seja, 


vz(x € (a,b) o Yy((y E€ £ > y = a) V (y E€ £ > (y =a V y = b)))) 


É fácil verificar que o par ordenado entre quaisquer conjuntos existe (aplicando 
três vezes o axioma do par: uma para formar o conjuntoi {a}, outra para o conjunto 
{a,b} e outra para o conjunto {{a}, {a,b}}) e é único (aplicação padrão do axioma 
da extensão). 

Assim, podemos introduzir a notação (a,b) como mais um símbolo funcional 
binário na nossa linguagem estendida da teoria dos conjuntos (ou mais uma abre- 
viatura). 

Notemos que, quando a = b, o par ordenado (a,b) é igual ao conjunto {{a}}. 


Teorema 8.2 Dois pares ordenados (a,b) e (c,d) são iguais se, e somente se, a = c 
eb=d. 


Demonstração: Um dos lados da equivalência é trivial: se a = c e b = d então os 
pares ordenados (a,b) e (c, d) são iguais. Mostraremos o outro lado. 

Suponha que (a,b) = (c,d). Como {a} € (a,b) temos que {a} € (c,d). Logo 
{a} = {c} ou {a} = {c,d}. Em ambos os casos temos que a = c. 
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Para provarmos que b = d, separemos em dois casos. No primeiro caso, supomos 
que a = b, o que implica que (a,b) = {{b}}. Teremos que {c,d} E (a,b) e, portanto, 
{c,d} = {b}, provando que b = d. No segundo caso, supomos que a £ b. Como 
{a,b} € (c,d) temos {a,b} = {c} ou {a,b} = {c,d}. Como {c} C {c,d}, em ambos 
os casos o axioma da extensão garante que b € {c,d}. Não podemos ter b = c, pois 
provamos que a = c e assumimos que a Æ b. Portanto, b = d. 

E 


8.2 Produto cartesiano 


O próximo teorema nos garante a existência do produto cartesiano entre dois con- 
juntos. 


Teorema 8.3 Dados dois conjuntos A e B, existe o conjunto de todos os pares or- 
denados (a,b) que satisfazem a E€ A ebe B. 


Demonstração: Usando os axiomas do par, da união, das partes e da separação, 
definimos o conjunto 


X = {x€ P(P(AUB)):Jadb(ae ANbeBAx = (a,b)) 


Para verificarmos que X atende as condições do teorema, só resta verificarmos que 
todo par ordenado (a,b), onde a € Ae b € B, pertence a P(P(AU B)). 

De fato, (fal, {a,b}} E P(P(AU B)) é equivalente a {{a}, fa, bh C P(AU B), 
que ocorre se, e somente se, {a} € P(A U B) e {a,b} E P(AU B), o que é verdade, 
pois {a} C AU B e {a,b} C AUB. E 


O conjunto estabelecido pelo Teorema 8.3 é chamado de produto cartesiano de A 
e B, e será denotado por 4 x B. Introduzimos essa notação como outra abreviatura, 
desempenhando o papel de um símbolo funcional binário. 

Quando A e B são iguais, utilizamos uma notação especial: denotamos o produto 
cartesiano A x A por 42. 


8.3 Relações 


Uma relação é um subconjunto de um produto cartesiano. 


Definição 8.4 Dizemos que R é uma relação (ou relação binária) entre A e B se é 
um subconjunto de A x B. Quando R é uma relação, utilizamos a notação xRy como 
abreviatura de (x,y) € R. 


Nos próximos capítulos estudaremos algumas propriedades das relações, bem 
como algumas relações especiais, como as funções, as relações de equivalência e as 
relações de ordem. 
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Exercícios 


1. Encontre uma definição alternativa para par ordenado de modo que o Teo- 
rema 8.2 continue valendo. Justifique. 


2. Prove que A x B = Ú se, e somente se A = ou B = Ô. 
3. Prove que, se AC C e Bc D, então Ax BcC xD. 
4. Vale a recíproca do exercício 3? Justifique. 


5. Descreva todos os elementos de P(2 x 2). 
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Capítulo 9 
Funções 


Uma função de A em B é uma relação que associa a cada elemento de A um único 
elemento de B. Posto isso formalmente temos a seguinte definição: 


Definição 9.1 Dizemos que uma relação F entre A e B é uma função de A em B 
se para todo x € A existe um único y € B tal que (x,y) € F. Isto é, F é uma função 
de A em B se a seguinte fórmula é verdadeira: 


(F C Ax B)(x € A > Jy( (x,y) E F))AYzYyYz(((x,y) E FA(z, z) E€ F) > (y = z)) 


. Notemos que a fórmula dada é uma conjunção de três subfórmulas. A primeira 
diz que uma função de A em B é uma relação entre A e B. Ou seja, para todo par 
ordenado (x,y) E€ f temos z € Aey € B. A segunda subfórmula diz que todo 
elemento de A é contemplada pela função F (quando não exigimos essa condição, 
dizemos que f é uma função parcial de A em B). Finalmente, a terceira subfórmula 
nos diz que a função só relaciona um elmento de B, para cada elemento de A. 

Denotamos por 4B o conjunto das funções de A em B. Deixamos como exercício 
ao leitor provar a existência de 4B, pois é uma simples aplicação do axioma da 
separação. Introduzimos, assim, mais um símbolo funcional binário na linguagem 1. 

Mantendo a tradição, usaremos preferencialmente letras minúsculas para denotar 
funções. 

Se f é uma função de A em B, dizemos que A é o domínio de f — que será 
denotado por dom(f) — e o conjunto {b € B : da((a,b) E f)+ é chamado de imagem 
de f — que será denotada por im(f). 

Normalmente se utiliza o termo contradomínio de uma função para designar o 
conjunto B, quando a função é de A em B. Todavia, esse termo não é muito adequado 
na definição aqui adotada de função, já que, dada uma função f, não é possível 
“recuperar” o contradomínio. Por exemplo, se tomarmos o conjunto (supondo que já 
temos construídos os números reais) f(x,y) € R? : y = x°}, esse pode tanto ser visto 
como uma função de R em R quanto uma função de Rem R, (os reais não-negativos). 

Por outro lado, essa ambiguidade não existe ao definirmos o domínio e a imagem 
a partir da função. É possível “recuperar” o domínio e a imagem de uma função. 


1A rigor, não há símbolo algum na notação 4B. Mas mantemos a nomenclatura por uma questão 
de conveniência, para se adequar à definição de linguagem de primeira ordem. 
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Abaixo seguem as definições do domínio e imagem a partir da função, e a tarefa de 
mostrar que essas definições cumprem o prometido é deixada ao leitor: 


dom(f) = {a elJUS :ab((a,b) e 1) 
im(f) = {bE [JUZ : aa((a,b) e f)) 


Nessas definições é bom notar em como os axiomas do par e das partes “empa- 
cotam” os conjuntos, enquanto o axioma da união “desempacota”. 

Também notamos que as mesmas definições podem ser aplicadas para relações 
binárias quaisquer. 

Como uma função associa a cada elemento do domínio um único elemento da 
imagem, podemos introduzir a seguinte notação: se (x,y) pertence a uma função f, 
denotamos y por f(x). Essa notação só é possível, pois, para x € dom(f), existe 
um único y satisfazendo (x,y) € f. Porém, precisamos ser mais cautelosos com essa 
notação do que somos com outras como a do par (fa, bh), da união de dois conjuntos 
(a Ub) e do par ordenado. Isso porque, enquanto as outras notações valem para 
quaisquer termos, f(x) só está bem definido quando f é uma função e x pertence ao 
domínio de f. Logo, não podemos desavisadamente introduzir essa notação como um 
símbolo funcional binário da linguagem, pois f(x) não está definido para quaisquer 
conjuntos f e x. 

Outra notação que podemos introduzir, que aparece na linguagem cotidiana da 
matemática, é f : A — B para designar que f é uma função de A em B, ou, em 
outras palavras (ou melhor, símbolos), f €^ B. 

Suponha que f é uma função de A em B e que C é um subconjunto de A. 
Definimos 


flc=(CxB)nf 


a restrição de f ao conjunto C. Fica como exercício ao leitor mostrar que f|C é uma 
função de C em B. 

Dizemos que uma função f : A —> B é injetora se, para todo x,y E€ A temos 
que, se x £ y, então f(x) Æ f(y). Ou seja, quando dois elementos distintos do 
domínio nunca são mapeados para o mesmo elemento da imagem. Dizemos que f é 
sobrejetora em relação a B se para todo y € B existe x € A tal que f(x) = y. Ou 
seja, quando B é a imagem de f. A necessidade de relativizarmos a B a definição de 
sobrejetora vem daquele problema anteriormente mencionado, sobre a impossibilidade 
de “recuperarmos” o contra-domínio de uma função. Quando está claro no contexto 
qual contradomínio está sendo considerado (quando, por exemplo, escrevemos que 
“f é uma função de A em B”) dizemos apenas que a função é sobrejetora, mas é 
necessária uma cautela extra para esse tipo de nomenclatura. 

Uma função f : A — B é bijetora (ou bijetora em relação a B) quando é 
injetora e sobrejetora (em relação a B). Nesse caso também dizemos que A é uma 
bieção entre A e B. No capítulo sobre conjuntos equipotentes discutiremos melhor a 
propriedade de existir uma bijeção entre dois conjuntos (lembram-se da introdução, 
sobre como comparar tamanhos de conjuntos infinitos?) 

Ainda há algumas definições a serem introduzidas, com as quais o estudante de 
matemática deve estar bem acostumado. Se f e g são funções, e im(g) C dom(f), 


53 


então definimos a função composta de f e g da seguinte forma: 


fog = {(x,z) E dom(g) x im(f) : Jy((x, y) E gA (y, z) E f} 


Novamente, é preciso tomar cuidado com essa notação, pois ela só faz sentido 
dentro das hipóteses estritas apresentadas acima. 


Exercícios 


1. Escreva uma fórmula de primeira ordem, de três variáveis livres, sem abreviaturas 
da linguagem de teoria dos conjuntos, que significa “x é uma função de y em 2”. 


2. Prove que f o g é injetora se, e somente se, f e g são injetoras. 
3. Em quais condições temos 4B C7 D? Justifique. 


4. Dada uma relação R, definimos a inversa de R — que será denotada por Rt — 
como o conjunto {(y, x) : (x,y) € R}. Com base nisso, prove as seguintes asserções: 


(a) Para toda relação R existe Rt. 
(b) Se f é uma função, ft é uma função se, e somente se, f é injetora. 
(c) Se f e g são funções injetoras tais que im(g) C dom( f), então (fog)! = g lo fr. 


5. Prove que existe uma função injetora de w em w que não é sobrejetora (em relação 
aw). 


6. Usando o axioma da regularidade, prove que, para todo conjunto x, não existe 
uma função f de w em x tal que f(n*) € f(n), para todo n € w. 
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Capítulo 10 


Construção dos conjuntos 
numéricos 


Neste capítulo definiremos os quatro principais conjuntos numéricos — os números 
naturais, inteiros, racionais e reais — juntamente com as operações de adição e mul- 
tiplicação. A partir deste capítulo o leitor deve se convencer que a maioria das con- 
struções matemáticas aprendidas até agora podem ser feitas a partir da teoria dos 
conjuntos. Faltam ainda o axioma da escolha e da substituição, úteis para algumas 
construções. 


10.1 Teorema da recursão 


Antes de definirmos as operações básicas nos números naturais, precisamos enunciar 
o teorema da recursão. 


Teorema 10.1 (da recursão) Sejam X um conjunto, x um elemento de X eg uma 
função de X em X. Então existe uma única função f de w em w tal que 


ha f0) =; 


e f(nt) = g(f(n)), para todo n € w. 


Demonstração: Usando o axioma da separação, defina o conjunto 
C={RE€ P(w x X): (0,£) € RAYnYy((n, y) € R > (n*,g(y))) € R}. 
Claramente w x X € C. Logo, C é não-vazio. Podemos, portanto, definir o conjunto 
f=(Je 
Precisamos provar que f é uma função e que satisfaz a condição para pertencer a C. 
Afirmação 1: fel 
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O procedimento da demonstração da afirmação 1 é análogo à demonstração que 
w é um conjunto indutivo. Como (0, x) € R, para todo REC, então (0,7) E f. Se 
(n,y) € f, então (n,y) € R, para todo R € C. Logo, pela hipótese sobre os elementos 
de C, (nt,g(y)) € R, para todo R € C. Logo, (nt, g(y)) € f, concluindo a prova da 
afirmação. 


Afirmação 2: f é uma função de domínio w 


Vamos provar, por indução, que para todo n € w vale a fórmula P(n), definida 
abaixo: 


P(n) = Inn, y) € f) A YyYz(((n, y) ERA (n, 2) € R) > (y = 2)) 


Vamos provar P(0). Pela afirmação 1, (0,17) € f. Vamos provar que, se (0,y) € f, 
então y = x. Suponha, por absurdo, que existe y Z x tal que (0,y) € f. Considere 
R = f~ {(0,y)}. Vamos verificar que R € C. De fato, (0,7) € R, pois (0,17) € f 
ex ty. Se(n,y) E€ R, então (n,y) E€ f, pois RC f. Logo, (n*,gly)) € f (pela 
afirmação 1). Como n* Æ 0 (axioma 4 de Peano), temos que (n*, g(y)) € f é diferente 
de (0, y) e, portanto, pertence a R. 

Portanto, concluímos que R € C, o que implica que f C R. Como R C f, temos 
f = R, absurdo, pois (0,y) € f e (0,y) É R. 

Vamos agora provar que P(n) implica P(n*). 

Assumindo P(n) como verdadeiro, temos que existe y tal que (n, y) E€ f. Logo, 
como f € C, temos que (n+, g(y) € f, provando a “primeira parte” de P(n”). 

Agora supomos, por absurdo, que existe z £ g(y) tal que (nt,2) € f. Defina 
R= fx {(n7,z)}. Vamos verificar que REC, 

Como n* Æ 0, continuamos tendo (0,x) € R. Suponha que (m, v) € R. Como 
feCeRCc f temos que (mt,g(v)) E R. Se m Æ n, o axioma 3 de Peano nos 
garante que mt Æ n”, logo, (m*,g(v)) Æ (nt, z), provando que (m*, g(v)) € R. Se 
m = n, pela hipótese indutiva P(n) temos que v = y (pois (n,y) € f), e já vimos 
que (n*, g(y) € f. Como z # g(y), também temos que (nf, g(y) € R. Provamos, 
com isso, que R € C o que novamente contradiz com o fato de R estar contido 
propriamente em f. Isso conclui a demonstração da afirmação 2. 


Das afirmações 1 e 2 segue imediatamente o teorema. Sendo f uma função de 
domínio w e satisfazendo as condições da família de conjuntos C, temos que (0,17) € f, 
o que significa que f(0) = x. Como, para todo n, temos, pela própria definição de 
função, (n, f(n)) € f, da afirmação 1 segue que (n*, g(f(n)) € f, o que significa que 
Hint) = g(f(n)). 

A unicidade da função f pode ser provada por indução. Suponha que existe 
h satisfazendo as mesmas condições do teorema estabelecidas para f. Temos que 
f(0) = h(0), pois ambos são iguais a x. Se f(n) = h(n), então g(f(n)) = g(h(n)), e 
ambos são iguais a f(nt) e h(n). Logo, por indução, f = h. 

E 
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10.2 Aritmética dos números naturais 


Já definimos w como o conjunto dos números naturais, e mostramos que ele satisfaz 
os axiomas de Peano. Falta definir a aritmética. Ou seja, precisamos definir duas 
funções de w x w em w que correspondem às operações de soma e produto. 

A ideia geral da definição da soma é utilizar o teorema da recursão para definir, 
para cada número natural m, uma função Sm : w —> w tal que 


Sia) 


Sm) = (sm(n))* 
e definimos m + n como sm(n). Utilizando novamente o teorema da recursão e a 
definição das funções acima podemos definir, para cada número natural m, uma 
função Pm : w — w tal que 
Pm(0) = 0 
Pm(n*) = (Pm(n))* 
e definimos m -n como pm(n). 


Essa definição de soma e produto ainda precisa ser melhor justificada, para pode- 
mos construí-la axiomaticamente. Façamos isso. 


Teorema 10.2 Existe uma função s de w em “w tal que, para todo nm E w, 
s(m)(0) = m e s(m)(n*) = (s(m)(n))*. 


Demonstração: Usando o axioma da separação defina 


E E T OE a 


Pelo teorema da recursão, utilizando-o para a função g = ((n,nt) : n € w}, 
para cada m existe uma única f satisfazendo as condições descritas na definição de 
s. Logo, s é uma função. 

E 


Definição 10.3 Definimos a operação de soma em w como a função + : wxw — w 
dada por +((m,n)) = s(m)(n). Denotamos +((m,n)) por m+n. 


Teorema 10.4 Existe uma função p de w em “w tal que, para todo n,m E w, 
p(m)(0) = 0 e p(m)(n*) = p(m)(n) + m. 
Demonstração: Usando o axioma da separação defina 

p= {(m, f) E€ w x” w : Yn((F(0) = 0) A (f(n) = (f(n) + m))) 


Tomando a função g = {(i, j) Eww : i +m = j}, o teorema da recursão garante 
que p é uma função. E 


Definição 10.5 Definimos a operação de soma em w como a função - : w X w — w 
dada por -((m,n)) = p(m)(n). Denotamos ((m,n)) pr m-n. 
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Da definição de soma e produto seguem os seguintes axiomas da aritmética de 
Peano, quando adicionamos os símbolos funcionais binários + e - à linguagem da 
aritmética: 

m+0=m 
m+nt=(m+n* 
m:0=0 
m:nt=(m:n)+n 


Eventualmente usaremos a notação xy para representar x - y. 


10.3 Relação de equivalência 


Para construirmos o conjunto dos números inteiros a partir do conjunto dos números 
naturais, e o conjunto dos números racionais a partir do conjunto dos número inteiros, 
precisamos, antes, desenvolver o conceito de relação de equivalência. 


Definição 10.6 Dizemos que uma relação R C X x X é uma relação de equivalência 
em X se satisfaz as seguintes propriedades, para todos z, y,z € X: 


e Reflexividade: x Rz; 
e Simetria: se xRy então y Rz; 
e Transitividade: se xRy e yRz então xRz. 


Definimos o conjunto das classes de equivalência de R como 


X/R= {Y € PX :davy(yeY Oo zRy)} 


Os elementos de X/R são, obviamente, chamados de classes de equivalência, 
também denotado do seguinte modo: 


X/R = {|e]:x € X} 


onde 
[z] = {y € X : xRy} 


Teorema 10.7 Seja R uma relação de equivalência em um conjunto X. As seguintes 
afirmações são verdadeiras: 


(a) UX/R=X; 
(b) 0 é X/R; 
(c) Para todos Y,Z € X/R, se Y # Z então Y NZ =; 


(d) Sex € Y e todo Y € X/R, para todo y € X temos que xRy se, e somente se, 
yEY. 
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Demonstração: Usaremos a notação |x] para o conjunto {y € X : xRy}. 

Dado x € X, temos que x € [x], uma vez que, pela propriedade reflexiva, x Rz. 
Isso prova (a). Como todo elemento de X/R é da forma [x], para algum x € X, isso 
prova também a parte (b) 

Para provar (c), assumindo que Y e Z são dois elementos de X/R que não são 
disjuntos, mostraremos que Y = Z. Sejam x € Y N Z e y0, 2o € X tais que Y = [yo] 
e Z = [zo]. Dado y € Y, temos, por definição, que yoRy. Logo, pela simetria, y Ryo. 
Mas como x € Y, temos yoRx. Pela transitividade temos yRz. Mas, como x € Z, 
temos zoRz e, pela simetria, xRzo. Logo, a transitividade nos dá yRzo e, novamente 
pela simetria, z9Ry, o que prova que y € Z. Isso conclui que Y C Z e um argumento 
análogo mostra que Z C Y, provando que Y = Z. 

Mostremos a parte (d). Se Y € X/R, existe yo € X tal que Y = [yo]. Como 
x € Y, temos que yọoRzx e, portanto, xRyọ. Se yRx, por transitividade e simetria 
temos y Ryo e yoRy, de onde temos que y € Y. Por outro lado, se y € Y, temos yo Ry 
e, portanto, xRy, concluindo a prova do teorema. [5] 


Em outras palavras, o Teorema 10.7 parte (d) nos diz que duas classes de equivalência 
[x] e [y] são iguais se, e somente se, xRy. 


10.4 Construção do conjunto dos números inteiros 


A construção dos números inteiros a partir dos naturais se assemelha muito à con- 
strução dos racionais a partir dos inteiros, sendo essa última mais conhecida. 

Iremos identificar pares de números naturais que “possuem a mesma diferença”. 
Por exemplo, identificaremos o par (5,3) com os pares (4,2), (6,4) etc. Assim, o 
número inteiro 2 é o conjunto ((2,0), (3,1), (4,2),... (sendo esses pares ordenados 
formados por números naturais), enquanto —2 é o conjunto ((0,2), (1,3), (2,4),...). 

Definimos R C (w x w)? como o conjunto dos pares ((a, b), (c, d)) tais que a +d = 
b+c. Deixamos como exercício ao leitor provar o seguinte fato: 


R é uma relação de equivalência 
Defina o conjunto dos números inteiros como 
Z=(wxw)/R 


Falta definirmos as operações de soma e produto em Z. Para não sobrecarregar 
o texto, abusaremos a notação utilizando os mesmos símbolos + e - para a soma e 
produto de números inteiros. Uma definição informal seria 


[(a, b)] + [(c, d)] = [a + c,b + d)] 


[(a,b)] - [(c,d)| = [(ac + bd, ad + be) 


Porém, tal definição não pode depender da escolha do representante. Nesta primeira 
vez que fazemos esse tipo de construção seremos mais rigorosos, definindo explicita- 
mente as funções de soma e produto. Como mais um abuso de notação, denotaremos 
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(ZxZ)xZ por ZxZx7Z, ou, simplesmente, Z’, e o par ((x, y), z) pela tripla (x,y, 2). 
Definimos: 


S=[(2,7y,2) € Z’ : JaIbIcId( (a,b) E€ x A (c,d) E y A (a+c, b+ d) ez) 


P = {(£,y, z) € Z? : JaIbIcad((a,b) € £ A (c,d) E€ y A (ac + bd, ad + bc) € 2) 


Teorema 10.8 Sejam S e P definidos como acima. Temos que 
(a) S e P são funções; 
(b) Para todos a,b,c,d em w temos que S(|(a,b)], [(c, d)]) = [(a + c, b + d)]; 


(c) Para todos a,b,c,d em w temos que P(I(a,b)], [(c, d)|) = [(ac + bd, ad + be)]. 


Demonstração: Para as três partes do teorema precisamos mostrar a independência 
em relação à escolha dos representantes. Isto é, mostraremos a seguinte afirmação: 


Afirmação: Se (a, b)R(a', b’) e (c,d)R(c',d') então (a+c,b+d)R(a' + 
c,b + d') e (ac + bd, ad + bc)R(a'd + b'd',a'd' + bc). 


Provaremos a afirmação assumindo as propriedaes conhecidas da aritmética: co- 
mutatividade, associatividade, lei do cancelamento etc. 

Suponha que (a,b)R(a',b') e (c,d)R(c',d'). Isso significa que a +b = b+ a 
ec+d =d+. Logo a+b +c+d =b+a +d++ cd, o que significa que 
(a+ecb+ DR(a +e, b +d’). 

Agora veremos que (ac + bd, ad + bo)R(a'c + b'd',a'd' + b'c’). 

Como a+b' =a +b ec+d' = d +d, temos que, para todos x,y,z, w em w, vale 
a seguinte igualdade: 


(a+b)x+(c+dDy+(a +b)z +(e +d)jw = (a +b)r +(e +djy+la+b)z+(e+d)w 


Tomando z = c+ c, y =a+a, z =d+d ew=b+b, utilizando as propriedades 
operatórias de números naturais, provamos que ac+bd+a'd'+b'd = ad+bc+a'd +b'd' 
e, portanto, (ac+ bd, ad+bc)R(a'd +b'd',a'd'+b'c'). Deixamos os detalhes das contas 
para o leitor completar. 


Vejamos como isso ajuda a provar o teorema. Para provar que S é uma função 
de Z? em Z, primeiro temos que provar que, para todo (x,y) € Z?, existe z tal que 
(x,y,z) E€ S. Mas isso é verdade, pois pelo Teorema 10.7, parte (b), existe x e y são 
não-vazios. Logo, existem (a,b) € x e (c,d) € y. Pela parte (a) do mesmo teorema, 
existe z tal que (a +c,b+ c) € z, o que nos dá, pela definição de S, que (x,y,2) E S. 
O mesmo argumento mostra que, para todo (x,y) € Z?, existe z tal que (x,y, z) € P, 
tomando, desta vez, z contendo (ac + bd, ad + be). 

Isso já prova, quando concluirmos que S e P são funções, as partes (b) e (c) do 
presente teorema. 
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Agora vejamos a unicidade. Suponha que (x,y,2) E€ S e (x,y,z) € S. Pela 
definição de S, (x,y,z) E€ S implica que existem números naturais a,b,c,d tais que 
(a,b)ezx,(cd)eyve(a+cb+d)Eez,e(x,y,z) E€ S implica que existem números 
naturais a',b',c',d' tais que (a',b) E€ x, (d,d) E y e (a +e, b +d) Ez. 

Note que não podemos, a princípio, assumir que os números a,b,c,d que teste- 
munham que (z, y, z) E S são os mesmos que testemunham que (z, y, z’) E S. 

Porém, como (a,b) e (a',b') ambos pertencem a x, o Teorema 10.7, parte (d), 
nos garante que (a,b)R(a',b). Da mesma forma temos (c, d)R(c',d'). Logo, pela 
afirmação, (a + cb + d)R(a' +c',b + d). Logo, o Teorema 10.7, parte (d), também 
nos assegura que (a'+c',b'+d”) € z. Portanto, (a'+c,b'+d) E zN7, o que implica, 
pela parte (c) do Teorema 10.7, que z = 2”, como queríamos provar. 

A demonstração de que P é uma função é análoga. 

E 


Sendo x e y números inteiros, denotamos S((x,y)) por x + y, e P((x,y)) por 
x-y ou, simplesmente, xy. Como estamos usando os mesmos símbolos em conjuntos 
diferentes, estamos fugindo um pouco do rigor da lógica, e precisamos estar atentos 
ao contexto. O importante é nunca perder a conexão com a linguagem lógica estrita, 
estando ciente de como cada uma dessas notações funciona como abreviatura. 

Definir função em classes de equivalência através de um representante, para de- 
pois mostrar que a definição independe da escolha do representatne, é uma prática 
bastante comum no cotidiano da matemática, com a qual o estudante deve ter se 
deparado diversas vezes. Aqui foi apresentada a formalização desse processo, que, 
como podemos notar, não é trivial, apesar de ser bem intuitivo. Reparem que todos 
os itens do Teorema 10.7 foram utilizados e, na demonstração desse, foram utilizadas 
todas as três propriedades de relação de equivalência. 


10.5 Construção do conjunto dos números racionais 


A construção de Q a partir de Z se assemelha muito à construção de Z a partir de w. 
Primeiro definimos o número inteiro 0 (eventualmente denotado por 0z, quando 

houver possibilidade de confusão com o número natural 0) como a classe [(0, 0)]. 
Definimos uma relação R em Z x (Z = (07!) como 


R= {((a,b), (c,d) € (Z x (Z~ 107) : ac = bd} 


Fica como exercício verificar que R é uma relação de equivalência. 
Definimos 


Q = (Z x (Z x {0z}))/R 


Obviamente, a classe de equivalência representada pelo par (a,b) corresponde ao 
número racional representado pela fração 7, e R é a equivalência de frações. 
Definimos a soma e o produto de números reais da seguinte forma: 


I(a, b)] + [(c, d)] = [(ad + be, bd)] 
[(a, b)] - [(c, d)] = [(ac, bd)] 
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Deixamos como exercício ao leitor provar que essa definição independe da escolha 
do representante. Os demais detalhes para a formalização são iguais aos que foram 
feitos anteriormente. 


10.6 Construção do conjunto dos números reais 


A construção que será feita nesta seção deve-se a Richard Dedekind (1831-1916). 

Para construirmos os números reais a partir dos racionais, precisamos, antes, 
introduzir uma série de definições para podermos falar da ordem em Q. 

Dizemos que um número inteiro x é positivo se existe n € w tal que n £ 0 e 
(n,0) E€ x. 

Dizemos que um número racional x é positivo se existe (a,b) € x tal que a e b 
são números inteiros positivos. 

Definimos uma relação < em Q da seguinte forma: a < b se, e somente se, existe 
um número racional positivo c tal que a + c = b. 

Dizemos que um subconjunto C de C é um corte se satisfaz as seguintes pro- 
priedades: 


e é não-vazio: Jx(x € C); 


e não contém todos os racionais: Jz(x € Q Az É C); 


e não tem máximo: VrJy : x < y; 


é fechado para baixo: VaVy((zECAy< ar) >7€C); 


contém todos os números racionais que estão entre dois de seus elementos: 
Vavyvz((re CAzZECAT<yAy<a SEC). 


Definimos o conjunto dos números reais como: 


R=(CcQ:C é um corte} 


Intuitivamente, pensamos em um número real, nesta construção por cortes, como 
o conjunto dos racionais menores do que ele. 

Dados dois números reais 4 e B (ou seja, dois cortes em Q) definimos a soma e 
o produto de 4 e B como: 


[A] + [B] = {a+b:a c Anbe B) 


[4] - [B] = (ze Q: Jaba c AAbEBAz<a:b)} 


Deixamos como exercício provar que as definições acima estão boas. Ou seja, que 
os subconjuntos de Q definidos acima são cortes. Ao leitor mais paciente indicamos a 
tarefa de provar todos os axiomas de corpo ordenado completo — com a ordem dada 
pela inclusão — que são estudados em Análise Real. 
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Exercícios 


1. Seja X um conjunto e sejam zo e yo dois elementos distintos de X. Considere a 
seguinte relação em X: 


R= (to, y) EXxX:r= y} U t(xo, Yo), (Yo, £o)} 
(a) Prove que R é uma relação de equivalência em X. 
(b) Descreva os elementos de X/R. 
2. Considere C um conjunto não-vazio de conjuntos não-vazios tal que, para todos 


x ey pertencentes a C, sex +yentãorNy=h. Seja X =I|JC. Defina em X a 
relação: 


R=((zy)eX:dz(ze CAarezavez)) 
(a) Prove que R é uma relação de equivalência em X. 
(b) Mostre que C = X/R. 
(c) Prove que duas relações de equivalência diferentes possuem classes de equivalências 
diferentes. 


3. Como fica uma relação de equivalência sobre Ø? Ela satisfaz o Teorema 10.7? 


4. Prove a propriedade comutativa da soma de números naturais e da soma de 
números inteiros. 


5. Prove que a relação R definida na Seção 10.4 é uma relação de equivalência 
(podendo assumir as propriedades usuais da soma de números naturais, como asso- 
ciatividade e a lei do cancelamento). 
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Capítulo 11 


Relações de ordem 


Vimos nos capítulos anteriores dois tipos importantes de relação: as funções e as 
relações de equivalência. O presente capítulo abordará um terceiro tipo de relação 
tão importante quanto as anteriores: as relações de ordem. 


Definição 11.1 Uma relação <C X x X é chamada de ordem em X se satisfaz as 
seguintes propriedades, para todos x,y,z € X: 


e Reflexividade: q < zx; 
e Transitividade: sex < y e y < z então x < z. 
e Anti-simetria: se x < y e y < x então £ = y; 


Chamamos de conjunto ordenado um par (X, <), onde < é uma ordem em X, e 
dizemos que X é o domínio da ordem <. 


Uma relação de ordem também é chamada de ordem parcial, para diferenciar da 
ordem total, que veremos daqui a pouco. 

Um exemplo de ordem em um conjunto X é a relação de inclusão. Isto é, o 
conjunto {(x,y) E€ X x X :x C y}. De fato, todo conjunto está contido nele mesmo, 
se x está contido em y e y está contido em z então x está contido em z, e o axioma 
da extensão nos garante que x = y toda vez que x está contido em y e y está contido 
em x. Por abuso de notação, usaremos, eventualmente, o símbolo C para designar a 
relação de inclusão, como conjunto de pares ordenados. 

Veremos que toda relação de ordem pode ser vista como uma relação de inclusão. 
Para explicar o que isso significa, introduzimos a seguinte definição: 


Definição 11.2 Sejam <, e <, duas ordens em X; e X5, respectivamente. Dizemos 
que <1 e <> são ordens isomorfas (ou que os conjuntos ordenados (X1, <1) e (X2, <2) 
são isomorfos) se existe uma função f : Xı — Xə bijetora em Xə tal que z <ı y 
se, e somente se, f(x) <o> f(y). 

Nesse caso, dizemos que a função f é um isomorfismo de ordens. 


O próximo resultado diz que toda ordem é isomorfa à relação de inclusão sobre 
algum conjunto. 
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Teorema 11.3 Seja (X,<) um conjunto ordenado. Existe um conjunto ordenado 
(Y,=) isomorfo a (X,<) tal que 


<= {(x,y EY XT) 


Demonstração: Defina f : X — P(X) como 


f(e) ={yE€EX:y< rx} 


Tome Y a imagem de f. Mostraremos que f é injetora, o que basta para provarmos 
que é bijetora em Y. 

Suponha que f(x) = f(y). Pela reflexividade, como x < xz e y < y, temos 
x E€ f(x)eyE fly). Como f(x) e f(y) são iguais, temos xz € f(y) ey € f(x). Pela 
definição de f isso nos dá x < y e y < x, que, pela anti-simetria, implica que £ = y, 
provando que f é bijetora em Y. 

Agora resta-nos mostrar que x < y se, e somente se, f(x) C f(y). Suponha que 
xz <y. Seja z € f(x). Temos que z < x e, por transitividade, z < y. Logo, z € f(y). 
Reciprocamente, suponha que f(x) C f(y). Como x € f(x), temos x € f(y), o que 
significa que x < y. E 


Listamos agora uma série de definições que serão usadas durante o livro. 


Definição 11.4 Seja < uma relação de ordem em um conjunto X. Para todo x € X 
e todo S C X não-vazio dizemos que 


o x é limitante superior de S se y < x, para todo y € S; 


x é limitante inferior de S se x < y, para todo y € S; 


S é limitado superiormente se possui um limitante superior; 

e S é limitado inferiormente se possui um limitante inferior; 

e x é máximo de S se x E€ S e y < x, para todo y € S; 

e x é mínimo de S se x E S ex < y, para todo y € S; 

e x é marimal se não existe y € X tal quer Lyerx<y; 

e x é minimal se não existe y € X tal que xt Æ z e y < z; 

e x é supremo de S se x é o mínimo dos limitantes superior de 5; 


e x é ínfimo de S se x é o máximo dos limitantes inferior de S; 


S é uma cadeia se, para todos y,z E€ S temos y < z ou z < y. 
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Essas definições dependem da ordem. Portanto, quando não estiver claro no 
contexto qual é a ordem que estamos considerando sobre o conjunto X, escrevemos 
<-máximo, <-mazximal etc. 

Notemos — pela definição e pela antissimetria da relação de ordem — que nem 
sempre um conjunto possui um elemento máximo, mas, se possuir, esse é único. O 
mesmo vale para mínimo, supremo e ínfimo. Porém, podemos ter vários limitantes 
superiores e inferiores de um conjunto e elementos maximais e minimais da ordem. 

Agora podemos enunciar os principais tipos de ordem usados na matemática: 


Definição 11.5 Dizemos que uma ordem < sobre um conjunto X é uma(um): 
e ordem total (ou ordem linear) se, para todos x,y € X temos z <youy<a; 
e boa ordem se todo subconjunto não-vazio de X possui elemento mínimo; 
e árvore se, para todo x € X, o conjunto {y € X : y < x) é uma cadeia em X; 
e reticulado se, para todos x,y € X, o conjunto (x,y) possui supremo e ínfimo. 


Aplicamos os termos acima também para o conjunto ordenado (X,<) e, por abuso 
de notação, para o domínio X. 


Uma ordem total tem esse nome porque todos os elementos do domínio podem 
ser comparados. Também a chamamos de ordem linear porque podemos visualizar 
todos os elementos da ordem como se estivessem numa mesma reta. As ordens usuais 
nos números naturais, inteiros, racionais e reais são exemplos de ordens totais. 

Nota-se que toda boa ordem também é uma ordem total, uma vez que o conjunto 
{x,y} tem mínimo, o que nos dá x < y ou y < z. 

Uma árvore é uma ordem que pode “bifurcar” , mas nunca “juntar”, como na copa 
de uma árvore, em que o tronco se ramifica em galhos, que se ramificam em galhos 
menores, mas os galhos nunca se reajuntam. Além das numerosas aplicações em 
teoria dos conjuntos, as árvores são usadas em computação e em teoria dos jogos. Por 
exemplo, as possíveis sequências de jogadas a partir de uma posição numa partida de 
xadrez formam uma árvore, que um programa de computador (ou o cérebro humano, 
de uma maneira mais intuitiva) analisará para poder decidir o melhor lance. 

Uma ordem total é uma árvore, já que todo o conjunto é uma cadeia e, portanto, 
todos seus subconjuntos são cadeias. 

Se considerarmos a ordem da inclusão em uma família de conjuntos fechada pelas 
operações de união e intersecção, essa ordem será um reticulado, onde o ínfimo de 
{x,y} é «Ny, e o supremo é rUy. Esse tipo de ordem é particularmente interessante 
nos estudos de álgebras de Boole. O reticulado é um pouco mais geral, pois temos as 
operações de supremo e ínfimo (que correspondem às operações booleanas “e” e “ou”) 
mas não precisamos do complemento (correspondente à operação booleana “não”). 

Também é evidente que toda ordem total é um reticulado, já que o próprio x e o 
próprio y serão um deles o ínfimo e o outro o supremo do conjunto {x,y}. 

Neste livro, nosso foco será no conceito de boa ordem, pela sua importância no 
estudo de ordinais e cardinais. Um boa ordem (X, <) também é chamada de conjunto 
bem-ordenado. 
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O próximo teorema é bastante importante para falarmos sobre ordem em w e 
discutir o conceito de infinitude. 


Teorema 11.6 Em w, vale as seguintes afirmações: 

(a) Para todos n,m E w, temos n E€ m oum En oun =m; 

(b) Para todos n,m € w temos n C m se, e somente se, n E M ou n = m; 
(c) Uw =w; 


(d) (w, C) é bem-ordenado. 


Demonstração: A parte (a) utiliza uma indução dupla que precisa ser analisada 
com cuidado. Considere a fórmula de duas variáveis livres 


P(nm=((newn(mew)>((nem)v(n=m)ví(men)) 
Para provar a parte (a) do teorema mostraremos, por indução em n, a fórmula 
(1) YnymP(n, m) 
O passo inicial da indução é mostrar que 
(2) YmP(0, m) 
e o passo indutivo é 
(3) YmP(n,m) > YmP(n*, m) 


No entanto, cada uma das fórmulas acima será provada por indução em m. O 
passo inicial de (2) é a fórmula P(0,0), que é obviamente verdadeira, pois 0 = 0. O 
passo indutivo é mostrar que 


(4) Ym(P(0,m) > P(0,m*) 


De fato, assumindo P(0,m) temos 0 € m, 0 = m ou m € 0. O terceiro caso não é 

possível, visto que 0 é o conjunto vazio. Se m = 0 temos que m* = {0} e, portanto, 

0 € m*. Se 0 em temos 0 € m*, pois m C m U {m}, concluindo a prova de (2). 
Para provar (3), antes provaremos, por indução em n, que, para todo n € w vale 


(5) Ym(m En —>(m* EnV m* =n)) 


De fato, se n = 0 a afirmação é trivial, já que a premissa m € 0 é falsa. Suponha 
que (5) vale para n e provaremos para nt. Suponha que m € n*. Isso significa que 
m En oum =n. O primeiro caso, pela hipótese de indução, implica que m* € n ou 
m* = n, o que garante que m* € nt. No segundo caso temos m* = nt, provando 


(5). 
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Voltemos à demonstração de (3). Fixe n € w e suponha valer P(n, m), para todo 
m. Sem E n, temos m E nf. Sem = n temos m E nf. Sen Em, por (5) concluímos 
que nt em ou nf = m, provando (3) e, consequentemente, a parte (a) do teorema. 

Para a parte (b), começaremos provando, por indução em n, que para todo número 
natural n 


(6) Ym(men>men) 


De fato, (6) vale trivialmente para 0. Supondo que (6) vale para n, seja m € n”. 
Nesse caso temos m En ou m = n, o que, em ambos os casos, implica que m C n. 

Agora precisamos mostrar a recíproca. Sejam m,n E w tais qem Cnem £n. 
Mostraremos que m € n. Suponha que seja falso. Pela parte (b) do teorema isso 
implica que n E€ m e, por (6), concluímos que n C m, contradizendo quem C ne 
mEn. 

A parte (c) é basicamente a transitividade de w. Suponha que x € Jw. Ou 
seja, x E€ n, para algum n € w. Mostraremos que x € w. Para isso, provaremos por 
indução em n que 


(7) nEvw>nNCU 


Para n = 0 a afirmação é trivial. Supondo que vale paran E wen C n, como 
nf =n U {n} temos que nf C w, provando (7). 

Reciprocamente, seja n € w. Temos n € nf ent € w, provando que n E Ju e 
concluindo a prova do item (c). 

Provemos agora a parte (d) do teorema. Primeiro provaremos, por indução em n, 
que todo natural n é bem-ordenado com a ordem da inclusão. O passo inicial n = 0 é 
trivial, já que O não contém sub-conjunto não-vazio. Supondo que n é bem-ordenado, 
considere S um subconjunto não-vazio de nt. Seja S” = Sx fnJ. Observe que S” C n. 
Se S” = Ú, então S = {n}, que possui n como elemento mínimo. Se S £ Ø, pela 
hipótese indutiva existe m que é o mínimo de S’. Como m € S”, temos que m €En. 
Logo, pela parte (b) do teorema, m C n, provando que m é o mínimo também de S. 

Seja agora S C w não-vazio. Pela parte (c), existe no E€ w tal que SN no £ À. 
Como no é bem-ordenado, seja m o mínimo de SN no. Mostremos que m é o mínimo 
de S. Seja n € S. Pelo item (a), temos n E no, n = no OU no € n. No primeiro caso, 
de n E€ S N no segue que m C n, pois é o mínimo de S N no. No segundo caso, como 
m E no, por (b) temos que m C no e, portanto, m C n. No terceiro caso, de m € no 
e no E n e do item (b) segue que m C no e no C n, de onde concluímos que m C n, 
provando que (w, C) é bem-ordenado. 

E 


Exercícios 


1. Considere X o conjunto das funções f tais que dom(f) € w e im( f) C w. Prove 
que (X,C) é uma árvore. 
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2. Considere X o conjunto dos subconjuntos finitos de w. Isto é, 


X=(Scw:Indf((n ew) A (f é função injetora de S em n))} 


Prove que (X,C) é um reticulado. Assuma, sem provar, que união e intersecção de 
conjuntos finitos são finitas. 


3. Considere X o conjunto dos subconjuntos finitos ou cofinitos de w. Isto é, 


X=(Scw:Indf((n e w)A((f é função injetora) (dom(f) e LSunSDA(im(f) E n))} 


Prove que (X, C) é um reticulado. 


4. Seja C uma cadeia no conjunto ordenado (X,C) do exercício 2. Prove que C é 
bem-ordenado. O mesmo vale para a ordem do exercício 3? Justifique. 


5. Dê exemplos ou prove que não existe: 

(a) Uma ordem total que não é uma boa ordem; 
(b) Uma árvore que não é uma ordem total; 

(c) Um reticulado que não é árvore; 


(d) Uma árvore que é um reticulado mas não é totalmente ordenado. 


Capítulo 12 


Indução e recursão transfinitas 


Podemos imaginar um conjunto bem-ordenado (quando esse não é isomorfo ao próprio 
w ou a algum número natural) como uma continuação de w. Em um conjunto bem- 
ordenado, também podemos falar de sucessor de um elemento — contanto que ele não 
seja o último (máximo) — como o mínimo do conjuntos dos elementos maiores do que 
ele. Porém, enquanto em w, todos os elementos, exceto o 0, são sucessores de alguém, 
em outro conjunto bem-ordenado podemos ter um elemento que não é sucessor de 
ninguém. Por exemplo, se considerarmos o conjunto wt com a ordem da inclusão, 
esse conjunto é bem-ordenado e possui um elemento máximo (a saber, o conjunto w) 
que é maior que todos e não é sucessor de ninguém. Podemos, ainda, adicionar um 
sucessor a w, formando o conjunto (w*)*, e assim por diante. 

O princípio de indução finita — que vimos valer para os números naturais — não 
contempla esses elementos que “ultrapassam” w. Para isso, precisamos uma versão 
mais forte de indução — chamada indução transfinita, que possa ser usada em qualquer 
conjunto bem-ordenado. 


Teorema 12.1 (da indução transfinita) Seja (X,<) um conjunto bem-ordenado. 
Seja < a relação dada porx < y se, e somente se, x < y ex 4# y. Seja P uma fórmula 
e suponha que, se P vale para todo y < x então P vale para x. Então P vale para 
todo x E X. 

Vz(Yyly < x > P?) > P) > YxP 


Demonstração: Seja S o conjunto de todos os elementos de X para os quais P 
não vale. Mostraremos que S é vazio. Suponha que não seja. Como (X, <) é bem- 
ordenado, S possui um elemento mínimo. Seja x o mínimo de S. Isso significa que 
x € S e, para todo y < x,y É S. Ou seja, P vale para todo y < x. Mas pela hipótese 
do teorema isso implica que P vale para x, contradizendo que x € S. E 


Notamos que, na recursão transfinita, não precisamos provar o passo inicial para 
o menor elemento do conjunto. Isso porque o passo indutivo já contempla esse caso, 
uma vez que, se x é o mínimo de X, naturalmente qualquer propriedade P vale para 
os elementos menores que x, por vacuidade. 

Onde há prova por indução existe definição por recursão. Para o teorema da 
recursão transfinita, introduzimos a notação T para o conjuto dos predecessores de 
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x, isto é, 
T=(VEX:y<anvAs) 
Essa é mais uma notação que exige cautela, visto que ela depende do conjunto 
. . —(X,<) 
ordenado (X, <). Formalmente, seria mais adequado escrevermos algo como x À 
mas isso sobrecarregaria a notação. 


Teorema 12.2 (da recursão transfinita) Sejam (X, <) um conjunto bem-ordenado, 


Y um conjunto não-vazio e g uma função de ULY :x E X} emY. Existe uma 
única função f de X em Y tal que 


Fa) = 9(F] 2) 


Demonstração: A prova do teorema da recursão transfinita é bem similar à prova 
do teorema da recursão finita (para os números naturais), utilizando, porém, a 
indução transfinita no lugar da indução finita. 

Seja S o conjunto de todas as relações RC X x Y tais que 


(x) Vavs(((e € X) A (s C R) A (s é função ) A (dom(s) =7)) > ((x,g(s)) E R)) 


Como X x Y satisfaz (x), temos que S é não-vazio. Seja 


f=[)s 


Mostraremos, por indução transfinita, que f é uma função de domínio X. É fácil 
verificar que f satisfaz (*), pois se s é uma função de x em Y que está contido em 
f, então s está contido em R, para todo RE S. Logo, g(s) € R, para todo RE S, o 
que implica que (x, g(s)) € f. 

Portanto, para concluir o teorema é suficiente mostrar, por indução transfinita, 
que f é uma função de domínio X, isto é, mostraremos que, para todo x € X vale a 
fórmula P(x) dada por 


Iyll(o,y) E€ f) A Valar, 2) E€ f) > (z =9))) 


Suponha que P(w) vale para todo w < x (lembrando que w < x significa w < x 


e w £x). Tome s = f N (x xY). Como P(w) vale para todo w €x, temos que s é 
uma função de x em Y e obviamente está contida em f. Portanto, por (x), temos 


que (x, g(s)) € f. 
Agora suponha que existe z  g(s) tal que (7,2) € f. Tome R = f= ((x,2)h. 


E 


Provemos que R satisfaz (x). Seja t uma função de a” em Y, para algum x € X, tal 
que t C R. Como R C f temos que t C f. Como f satisfaz (x), (x',g(t)) E f. Se 
q + x temos que (x',g(t)) E S. Se x! = x, pela hipótese de que P(w) vale para todo 
w < «x temos que t = s e, portanto, como z Æ g(s), (x,g(t)) E R. 
Portanto, R € S, o que implica que f C R, contradizendo a defnição de R. 
Provamos, assim, que P(x) é verdadeiro, quando P(w) é verdadeiro para todo 
w <x. Logo, por indução transfinita, P(x) é verdadeiro para todo x € X. Portanto, 
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f é uma função e, como f satisfaz (x), provamos que ela satisfaz as condições do 
teorema. 

A unicidade da função f segue do princípio da indução transfinita. Seja f’ uma 
função que satisfaz o enunciado do teorema. Suponha que f(y) = f'(y), para todo 
y <x. Temos que 


Ha) = (12) = g(f| 2) = Ha) 


Assim, por indução provamos que f = f’. 


Exercícios 


1. Usando o teorema da recursão e o Teorema 11.6, prove o seguinte resultado, 
também conhecido como recursão completa: 

Se X é um conjunto não-vazio e g uma função de ("°X : n € wl em Y. então 
existe uma única função f de w em X tal que, para todo n E w 


fin) = 9(fIn) 
2. Prove o resultado do exercício 1 usando recursão finita (Teorema 10.1). 


3. Prove que a função identidade é o único isomorfismo de um conjunto bem- 
ordenado nele mesmo. 


4. Sejam (X,<1) e (Y, <2) dois conjuntos bem-ordenados tais que Y domina estri- 
tamente X. Prove que existe y € Y tal que (X, <1) é isomorfo a Y, com a ordem 
herdada de Y, isto é, com a ordem < N(Y x Y). 


5. Seja f uma função definida em um conjunto bem-ordenado (X,<) e suponha 


que f(x) = im(f] T), para todo x € X. Prove que a imagem de f é um conjunto 
transitivo. 
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Capítulo 13 


Axioma da escolha 


O axioma da escolha enuncia que, dada uma família de conjuntos não-vazios, existe 
uma função que a cada conjunto pertencente a essa família seleciona um elemento 
desse conjunto. 


Axioma 9 (da escolha) Para todo conjunto x de conjuntos não-vazios existe uma 
função f : x — l zx tal que, para todo y € x, fly) € y. 


Ve(O É x > If((f é função) A (dom(f) = x) A Vy(y € z — f(y) € y))) 


A função f garantida pelo axioma da escolha é chamada de função de escolha. 

Esse é certamente o axioma mais controverso da teoria dos conjuntos, rejeitado 
por algumas correntes filosóficas da matemática, como os construtivistas. Por isso 
alguns matemáticos preferem tomar um cuidado especial quando utilizam o axioma 
da escolha, evitando-o a todo custo, referindo-se por ZF ao sistema de axiomas de 
Zermelo e Fraenkel sem o axioma da escolha e por ZFC ao sistema ZF com o axioma 
da escolha (a letra C vem de choice, da sigla em inglês). 

Para entendermos melhor por que esse axioma é tão controverso, precisamos 
entender para quais construções ele é necessário. Ou seja, precisamos entender para 
quais conjuntos x a existência da função de escolha depende do axioma da escolha e 
para quais podemos prová-la em ZF. 

Primeiro notemos que, se x for finito (isto é, se existe uma função bijetora entre x 
e um número natural) então a existência de uma função de escolha é garantida pelos 
outros axiomas. Por exemplo: se x é o conjunto {a,b,c}, sendo seus três elementos 
não-vazios, sabemos que existem ag € a, bọ E be co E c. Usando sucessivas vezes o 
axioma do par, da união, das partes e da separação (como fizemos quando mostramos 
a existência de pares ordenados) construímos o conjunto ((a, ao), (b, bo), (c, co) +, que 
é precisamente uma função de escolha no conjunto x. 

Formalizando o argumento geral, temos o seguinte: provaremos por indução em 
n que, dados x um conjunto de conjuntos não-vazios, n um número natural e s 
uma função bijetora de n em x, existe uma função de escolha em x. Sen = 0, x 
necessariamente será o conjunto vazio e, portanto, o conjunto vazio é uma função de 
escolha em x (verifiquem que, de acordo com a definição dada neste livro, Ø é uma 
função de Ø em Ø). Suponha que a hipótese de indução é verdadeira para algum 


To 
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natural n, e provaremos para n*. Sejam x um conjunto de conjuntos não-vazios e s 
uma função bijetora de n” em x. Como n” = n U {n}, defina t a restrição de s a n, 
isto é, t = ((m, s(m):m € n}. Defina y = im(t). Claramente t é uma bijeção de n 
em y. Logo, pela hipótese indutiva, existe g : y — | y tal que g(z) € z, para todo 
z € y. Como s(n) Æ Ú, pois s(n) € x, existe a € s(n). Defina f = g U ((s(n),a)+. 
Como z = yU {s(n)} é fácil verificar que f é uma função de escolha em z. 

Ou seja, se substituirmos “para todo x” pela expressão “para todo x finito” no 
enunciado do axioma da escolha, teremos um teorema que é válido em ZF. 

Outro caso bem significativo em que não precisamos lançar mão do axioma da 
escolha para provarmos a existência de uma função de escolha é quando existe uma 
fórmula que desempenha esse papel de selecionar exatamente um elemento de cada 
conjunto que pertence a x. 

De fato, suponha que existe uma fórmula P(y, z) tal que, para todo y € x, existe 
um único z em y para o qual P(y,z) é verdadeira. Isto é, suponha que existe uma 
fórmula P para a qual conseguimos provar que 


Vy(y E€ xz > 3!z(z €E y A P)), 


onde o símbolo J! é definido da seguinte forma: 


IA = IAAA Yw( A? > (z = w))) 


Nesse caso, provamos a existência da função de escolha usando o axioma da separação: 


f={,2) €x x| ]z: (z €y) ^P} 


Por exemplo, suponha que x é um conjunto formado por subconjuntos não-vazios 
de w. Vimos em um exercício do capítulo anterior que w é bem-ordenado pela relação 
de inclusão (que coincide com a relação de ordem usual dos números naturais), o que 
significa que cada subconjunto não-vazio de w possui um único elemento que está 
contido em todos os demais (isto é, o mínimo desse subconjunto). Logo, podemos 
definir a seguinte função de escolha 


f=lyn)ezxw:(ney)Ayimmey>ncoem) 


O fato de (w, C) ser bem ordenado garante que f é uma função cujo domínio é 
x, e é claramente uma função de escolha. 

Vimos, portanto, dois casos particulares do axioma da escolha que são teoremas 
de ZF. Então surge a pergunta: quando precisamos do axioma da escolha para provar 
a existência de uma função de escolha em x? A resposta é: quando x é infinito e 
não existe uma maneira explícita e bem determinada de escolher um único elemento 
de cada elemento de x. 

Bertrand Russell forneceu uma comparação bastante interessante e curiosa para 
explicar o axioma da escolha: para escolhermos uma meia de cada par de meias, 
dentre uma coleção infinita de pares de meias, precisamos usar o axioma da escolha; 
se forem sapatos, não precisamos. Isso porque, no caso dos sapatos, podemos escolher 
o pé direito de cada par, e, no caso das meias, os pés de cada par são indistinguíveis. 


TT 


Portanto, os objetos matemáticos cuja existências dependem do axioma da es- 
colha não podem ser construídos explicitamente, de forma que possamos determinar 
precisamente quais são os seus elementos. Quando dizemos que há uma função de 
escolha em um conjunto zx e, para isso, foi essencial o uso do axioma da escolha, isso 
significa que há, na verdade, uma infinidade de possíveis funções de escolha, e que não 
podemos precisar qual função nós estamos considerando. Tais objetos matemáticos 
são ditos não-construtíveis e, para alguns matemáticos, nada vale provarmos a ex- 
istência de um objeto que não conseguimos explicar exatamente quem ele é. 

Porém é certo que, desde o início, como mostramos na introdução, a teoria dos 
conjuntos não agradou os construtivistas. A prova de Cantor de que existem muitos 
números transcendentes independe do axioma da escolha e, mesmo assim, é altamente 
não-construtiva. Ainda assim, há muitos que aceitam ZF como algo suficientemente 
construtivo, mas recusam trabalhar em ZFC. 

Um dos resultados dependentes do axioma da escolha e que mais agravaram 
a polêmica em torno dele é o paradoxo de Banach-Tarski: existe uma forma de 
particionar uma bola no espaço em uma quantidade finita de partes e remontar essas 
partes para formar duas bolas disjuntas, idênticas à primeira. Para muitos, esse 
resultado apenas prova que não existe uma medida universal finitamente aditiva em 
R3. Para outros, no entanto, essa é uma evidência de que as aplicações do axioma 
da escolha são inúteis, sem nenhuma conexão com a realidade. 

Por outro lado, muitos resultados importantes da matemática dependem do ax- 
ioma da escolha, como a existência de uma base em qualquer espaço vetorial e o 
Teorema de Hahn-Banach. Mas a maior aplicação do axioma da escolha é na teoria 
dos cardinais. O fato de podermos atribuir a qualquer conjunto um “tamanho” — ao 
qual chamamos de cardinalidade — depende do axioma da escolha. 

Feita essa pequena discussão filosófica sobre o axioma da escolha, enunciamos, 
agora, suas principais aplicações. Começamos mostrando a forma equivalente ao 
axioma da escolha mais utilizada na matemática. 


Teorema 13.1 (Lema de Zorn) Se(X,<) é uma ordem parcial em que toda cadeia 
admite limitante superior, então (X,<) admite um elemento maximal. 


Demonstração: Primeiro vamos discutir um pouco a ideia intuitiva desse teorema 
(que, por motivos históricos, recebeu essa alcunha de lema). Suponha que (X leg) 
não admita um elemento maximal. Notemos que a hipótese do teorema implica que 
X é não-vazio (por quê?). Tomamos, então, algum zo E€ X. Como zo não é maximal, 
encontramos algum x estritamente maior que zọ. Da mesma forma podemos encon- 
trar algum z maior que x, e assim por diante (aqui podemos imaginar que o axioma 
da escolha é necessário para tomarmos sempre um elemento maior do que outro). 
Após chegarmos em infinitos elementos de X através desse processo, notamos que 
esses formam uma cadeia, e, então, pela hipótese, tomamos y um limitante superior 
dessa cadeia, e iniciamos novamente o processo. A ideia intuitiva é que, em algum 
momento, esse processo tem que parar, chegando num elemento maximal. Como, 
infelizmente, não tem como formalizarmos essa ideia, não nos resta outra solução a 
não ser procurar uma demonstração rigorosa, que é árdua, trabalhosa e pouco intu- 
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itiva. A discussão precedente só serve para dar ao leitor uma vaga noção sobre o que 
significa o lema de Zorn e por quê ele vale. 

Vamos à demonstração formal, que é adaptada do livro de Halmos, que, por sua 
vez, atribui a Zermelo a criação dessa prova. 


Começamos definindo X o conjunto das cadeias em X, ordenado pela inclusão. 
Mostraremos que X tem um elemento maximal, e isso será suficiente para mostrar 
que X tem um elemento maximal, conforme a seguinte afirmação: 


Afirmação 1: Se X possui um elemento maximal então X possui um 
elemento maximal. 


De fato, suponha que 4 é um elemento maximal de X. Pela hipótese sobre X, 
seja x E€ X um limitante superior de 4, ou seja, a < x para todo a € A. Temos 
que x E€ À pois, caso contrário, teríamos que AU {x} seria uma cadeia que contém 
propriamente 4, contradizendo a maximalidade de A. Temos que x é maximal em 
X, pois, se existisse y € X tal que z < ye ax Æ y teríamos novamente que AU {y} 
seria uma cadeia maior que A. Isso conclui a prova da afirmação. 


Afirmação 2: Se C é uma cadeia em X então JC € X. 


Como [JC é claramente um subconjunto de X, para mostrarmos a afirmação 
basta provarmos que [JC é uma cadeia em X. Sejam a e b pertencentes a JC. 
Sejam A, B € C tais quea € Ae be B. Como C é uma cadeia, temos que AC B 
ou B C A, o que significa que a,b € A ou a,b € B. Como C C X, tanto A quanto B 
são cadeias, o que significa que a < boub <a. 


Seja f uma função de escolha em P(X)Ē {Ø}. Definimos uma função s : X — X 
como 


TEI AU{f({r e XN A: AU{r} e XP, se A não é maximal; 


A, se À é maximal; 


A função s faz o seguinte: se A é uma cadeia não-maximal, s estende A acrescentando- 
lhe um único elemento. Se A é uma cadeia maximal, s( A) = A. Se A é uma cadeia 
não-maximal, existirá x É A tal que AU (x) é uma cadeia, pois o subconjunto de 
uma cadeia é uma cadeia. Reparem a necessidade de usar o axioma da escolha para 
podermos escolher um elemento para estender a cadeia 4. 


Com essa definição e pela afirmação 1, nossa tarefa de demonstrar o lema de Zorn 
se reduz, agora, à tarefa de mostrar que existe A € X tal que s(4) = A. 


Antes de prosseguirmos a demonstração, precisamos de mais algumas definições. 
Dizemos que um subconjunto T de X é uma torre se satisfaz as seguintes condições: 


e OET; 
e se A E€ T então s(A) € T; 


e se C é uma cadeia em (T, C) então JC ET. 
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Existe pelo menos uma torre, pois claramente X é uma. Logo, podemos introduzir 
a seguinte definição: 
Xo = (KT C X :T é uma torre}. 


Afirmação 3: Xo é uma torre e está contida em qualquer outra torre. 


Deixamos a cargo do leitor provar essa afirmação, que é bem semelhante à demon- 
stração de que w é um conjunto indutivo. Pela minimalidade de Xo iremos fazer 
algumas provas utilizando uma espécie de indução, onde s desempenha o papel de 
sucessor. Na verdade, pela terceira condição sobre torres, essa indução mais se aprox- 
ima da indução transfinita, que veremos posteriormente. 


Nosso próximo objetivo será mostrar que Xo é uma cadeia em X. Feito isso, não 
teremos dificuldades em mostrar que LJ Xo é maximal em X, isto é, é uma cadeia em 
X que não está contida propriamente em nenhuma outra cadeia. Pela afirmação 1 
isso será suficiente para provarmos o lema de Zorn. 


Dizemos que um elemento C de Xo é comparável se, para todo A € Xo, temos 
ACCoCcÃaA. Mostrar que Xo é uma cadeia é o mesmo que mostrar que todo 
elemento de Xo é comparável. 

Introduzimos agora mais uma definição provisória (a última!): uma função g : 
Xo — P(Xo) dada por 


(0) =(4€ X :(ACO)v(s(C) c A) 


Se o leitor teve paciência de acompanhar até aqui, anime-se, pois a demonstração 
está chegando no fim. Faltam ainda mais algumas afirmações. 


Afirmação 4: Se C é comparável então g(C) = Xo. 


A prova dessa afirmação usa uma espécie de indução, como dissemos anterior- 
mente. Precisamos apenas mostrar que g(C) é uma torre e seguirá da afirmação 3 
que g(C) = Xo. 

Está claro que Ø € g(C), pois Ø C C. Seja S uma cadeia em g(C). Temos duas 
possibilidades: ou todo 4 € S está contido em C ou existe pelo menos um A € S 
tal que s(C) C A. No primeiro caso, temos JS C C e, portanto, JS e g(C). No 
segundo caso, como A C [J S, temos s(C) C JS e, novamente, JS € g(C). Para 
mostrar que g(C) é torre só falta mostrar que, se A € s(C) então s(4) € g(C). 

Seja A € g(C). Temos três casos. Ou A = C, ou A está contido propriamente 
em C ou s(C) C A. 

No primeiro caso, temos s( A) = s(C). Em particular, s(C) C s(A), o que prova 
que s(4) € g(C). 

No segundo caso, supomos que A está contido propriamente em C. Como C 
é comparável, temos C C s(A) ou s(A) C C. Se s(A) C C temos s(A) € g(C). 
Assumimos, então, que C C s(A). Se C = s(A) caímos no caso s(A) C C. Se 
C Æ s(A) existe x € s(A) = C. Mas, pela hipótese de A estar contido propriamente 
em C, existe y ECN A. Portanto, x e y são elementos distintos (pois um pertence a 
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C e outro não) de s(4) = A, contradizendo que s(A) tem, no máximo, um elemento 
que não pertence a 4. 

No terceiro caso, se s(C) C 4, como A C s(A) temos s(C) C s(4), o que nos dá 
s(A) € g(C). Concluímos, assim, a prova da afirmação. 


Afirmação 5: X é uma cadeia em X. 


Vamos provar “por indução” que todo elemento de Xo é comparável. Ou seja, 
mostraremos que o conjunto dos elementos comparáveis de Xo é uma torre e, por- 
tanto, coincide com todo o conjunto Xo. 

Como À) C A, para todo A, temos Ú é comparável. Seja S uma cadeia em Xo 
formada de elementos comparáveis. Mostraremos que [JS é comparável. De fato, 
seja A € Xo. Se existe C € S tal que A C C, temos, em particular, A C JS. Caso 
contrário, como todo elemento de S é comparável, temos Č C 4, para todo C ES, 
o que nos dá |J S C A. 

Falta mostrar que, se C é comparável, s(C) é comparável. Seja 4 € Xo. Pela 
afirmação 4 temos que A € g(C). Ou seja, A C C ou s(C) C A. Como C C s(C), 
temos Á C s(C) ou s(C) C A, provando que s(C) é comparável. 

Isso conclui que o conjunto dos elementos de Xo é uma torre, provando a afirmação. 


Afirmação 6: U Xo é maximal em X. 


Seja C = [J Xo. Provemos que s(C) = C. Como, pela afirmação 5, Xo é uma 
cadeia, a afirmação 3 — que diz que Xo é uma torre — nos garante que C € Xo. 
Portanto, novamente pela afirmação 3, s(C) € Xo. Isso implica que s(C) c U Xo. 
Ou seja, s(C) c C. Como C C s(C) concluímos que s(C) = C, provando a afirmação. 

Portanto X tem um elemento maximal e, pela afirmação 1, X também possui, 
provando o lema de Zorn. 

E 


Como uma consequência simples do lema de Zorn, mostramos que todo conjunto 
pode ser bem-ordenado. Embora a prova detalhada desse resultado seja um pouco 
longa, são argumentos bem comuns e corriqueiros, sem tantos “truques” como na 
demonstração do lema de Zorn. 


Teorema 13.2 (Princípio da Boa Ordem) Para todo conjunto X existe uma relação 
< tal que (X,<) é uma boa ordem. 


Demonstração: A demonstração do princípio da boa ordem é uma aplicação stan- 
dard do lema de Zorn. Diversos resultados clássicos da matemática — como a ex- 
istência de base em espaços vetoriais e o teorema de Hahn-Banach — utilizam ar- 
gumentos bem parecidos. A ideia é simples: se quisermos mostrar que uma pro- 
priedade vale para um conjunto X, consideramos todos a ordem parcial constituída 
dos subconjuntos de X que satisfazem tal propriedade (no caso, ser bem-ordenado). 
Verificamos que a hipótese do lema de Zorn é atendida e tomamos Y um elemento 
maximal dessa ordem parcial. Se Y não for todo o conjunto X, mostramos que esse 
pode ser estendido um pouco mais, contradizendo sua maximalidade. 


81 


Quando a propriedade que queremos mostrar para X envolve alguma estrutura 
— neste caso, uma ordem — é natural que, nessa ordem parcial que criamos, consid- 
eremos algo a mais que os subconjuntos de Y. No caso deste teorema, o domínio da 
ordem parcial é formada pelos conjuntos bem-ordenados (Y, <) tais que Y C X, e 
na definição da ordem, precisamos respeitar a compatibilidade entre esses conjuntos 
ordenados. 

Vamos à demonstração. 


Definimos uma ordem parcial (X, <) da seguinte forma: X é o conjunto de todos 
os conjuntos bem-ordenados (Y,<) tais que Y C X, e(Y,<1) 3 V2, <2) se, e 
somente se, as seguintes condições são satisfeitas: 


H Yı E Yz; 
2. x X; y se, e somente se, £ Xa y, para todos x,y € Y1; 
3. sexE Yey EY x Y então z < y. 


Fica como exercíco ao leitor mostrar que (X, <) é um conjunto ordenado. Provare- 
mos que ele satisfaz a hipótese do lema de Zorn. 
Seja S uma cadeia em X. Definimos 


Kalor 


A E; 


<= Je: JY” : (Y', <^) E€ S} 


Afirmação: (Y, <) € X e é um limitante superior de S. 


Para provar a afirmação, primeiro verifiquemos que < é uma boa ordem sobre X. 
Como S é uma cadeia, dados x,y,z € Y existe (Y,<) € S tal que z,y,z € Y' e, 
para todos u,v € Y’, temo u < v se, e somente se, u <' v. Portanto, as propriedades 
de ordem são satisfeitas para <, pois são satisfeitas para <’. Portanto, < é uma 
ordem. 

Para verificar que < é uma boa ordem, considere Z C Y um conjunto não-vazio. 
Portanto, existe (Y1, <1) E€ S tal que Z N Yı # Ø. Por hipótese, existe z € Z N Yı que 
é mínimo, em relação à ordem <,. Vamos mostrar que também é o mínimo de Z, em 
relação a <. 

Suponhamos, por absurdo, que existe w € Z tal que w # z e w < z. Como z é 
mínimo de Z NY, temos que w É Y Tome (Y2, <2) tal que w € Y2. Como S é uma 
cadeia, vale (Y2, <2) < (Y1, <1) ou (Y1, <1) = (Y2, <2). Mas o primeiro caso não é 
possível, pois w € Yə x Y4. 

Temos, então, (Y1, <1) < (Y2, <2). Da condição 3 da ordem = segue que z <z w. 
Porém, como w < z, da definição de <, do fato de Ș ser uma cadeia e da condição 2 
da ordem < seguem que w <p z (deixamos os detalhes dessa passagem como exercício 
ao leitor). Portanto, a antissimetria de <>, nos dá que w = z, contradizendo nossa 
hipótese e provando a afirmação. 
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Agora, aplicamos o lema de Zorn para obter (Y, <) maximal em X. Tudo que 
precisamos para concluir o teorema é provar que Y = X. De fato, suponha que 
Y # X. Tomex € Xx Y. Considere Y’ = Y U (x) e defina uma ordem <’ em Y” 
acrescentando a condição y < x, para todo y € Y. Isto é, <=<Ul(y, ar) ve Y}. 
Claramente (Y”, <”) é um conjunto bem-ordenado, diferente de (Y, <) e tal que (Y < 
) < (Y',<'), contradizendo a maximalidade de (Y, <). 

w 


Os dois teorema anteriores são, na verdade, formas equivalentes ao axioma da 
escolha, como mostra o seguinte resultado: 


Teorema 13.3 Em ZF, são equivalentes: 


(a) Axioma da escolha; 
(b) Lema de Zorn; 


(c) Princípio da boa ordem. 


Demonstração: Já provamos que (a) implica (b) e que (b) implica (c), lembrando 
que a demonstração do princípio da boa ordem não utiliza diretamente o axioma da 
escolha, mas apenas o lema de Zorn. Resta mostrar que (c) implica (a), cuja ideia 
da demonstração já foi discutida no início deste capítulo. 

Seja X um conjunto de conjuntos não-vazios. Aplicando o princípio da boa 
ordem, considere < uma boa ordem no conjunto |) X. Definiremos uma função de 
escolha que a cada elemento x de X associa o mínimo de x, isto é: 


f=em)exx|Jx (gemnvazelIX>y<: 


Pela propriedade de boa ordem e pelo fato de Ø ¢ X, para todo x € X existe 
y € Ja tal que (x,y) € f. A unicidade do elemento mínimo, como já foi discutido 
anteriormente, segue da antissimetria da ordem (se y e z fossem “dois mínimos”, 
teríamos y < ze z < y, o que implica que y = 2). 

Portanto f é uma função, e é justamente uma função de escolha em X. 


Exercícios 


1. Discuta a seguinte afirmação: sempre que a existência de uma função de escolha 
sobre um conjunto vale em ZFC mas não é assegurada em ZF, temos, em ZFC, mais 
de uma função de escolha sobre esse conjunto. 


2. Seja X um conjunto não-vazio tal que, para todo n € w, não existe uma função 
de domínio n e imagem X. Prove que existe uma função injetora de w em X. 


3. Na demonstração do princípio da boa ordem, por que assumimos a condição 3 
da ordem =? A afirmação contida na demonstração seria verdadeira ou falsa, se 
tirássemos essa condição? Justifique. 
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4. Prove que todo espaço vetorial sobre R possui uma base (algébrica). 


5. Prove em ZF (sem assumir o axioma da escolha) que w x 2 e w x w podem ser 
bem-ordenados. 
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CAPÍTULO 13. AXIOMA DA ESCOLHA 


Capítulo 14 


Conjuntos equipotentes 


Este capítulo aborda o assunto discutido na introdução, que deu origem a toda a 
teoria dos conjuntos: a comparação entre conjuntos infinitos pela “quantidade” de 
elementos. 


Definição 14.1 Dizemos que dois conjuntos X e Y são equipotentes se existe uma 
função bijetora de X em Y. Usamos a notação X = Y para denotar que X e Y são 
equipotentes. 


Está claro que X ~ X e que X = Y se, e somente se, Y = X. Também é 
fácil verificar (pois a composta de funções bijetoras é bijetora) que X xY eY xZ 
implica X ~ Z. Ou seja, = é uma espécie de relação de equivalência sobre a classe 
de todos os conjuntos. É claro que, como não existe conjunto de todos os conjuntos, 
não podemos considerar = como uma relação (a menos quando o restringimos a uma 
família particular de conjuntos), mas, sim, como um símbolo relacional binário que 
adicionamos à linguagem, que satisfaz as propriedades de uma relação de equivalência 
(reflexividade, simetria e transitividade). 

Agora que já estabelecemos o conceito de “conjuntos do mesmo tamanho” pode- 
mos falar sobre conjuntos “menores” que outros. 


Definição 14.2 Dizemos que um conjunto Y domina um conjunto X se existe uma 
função injetora de X em Y. Dizemos que Y domina estritamente X se Y domina 
X mas X não domina Y. Denotamos por X < Y quando Y domina X e X<Y 
quando Y domina estritamente X. 


É fácil verificar que X < Y eY < Z implicam que X < Z. Também é imediato 
que X < X. Para podermos dizer que < estabelece uma relação de ordem na 
classe de todos os conjuntos, precisaríamos ter que X < Y e Y < X implica X = Y. 
Obviamente, isso não vale, pois existem conjuntos equipotentes diferentes, e conjuntos 
equipotentes dominam um o outro. Porém, é de se esperar que se X < Y eY < X 
então X x Y. 


Lema 14.3 Sejam X e Y conjuntos não-vazios. Temos que X < Y se, e somente 
se, existe uma função sobrejetora de Y em X. 
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Demonstração: Suponha que existe f : X —» Y injetora. Tome x, E€ X um ele- 
mento qualquer. Defina g : Y — X como gly) = f”!(y), se y € im(f) (lembrando 
que f é bijetora sobre sua imagem) e gly) = xo se y E Y = im(f). 
Suponha agora que existe g : Y — X sobrejetora. Considere a função h : X — 
P(Y) dada por 
h(x) = {y EY : gly) =x} 


Como g é sobrejetora, h(x) £ Ø, para todo x € X. Usando o axioma da escolha 
defina uma função s : im(h) — Y tal que s(4) € A, para todo A € im(h). Defina 
a função f : X — Y por 

Fa) = s(h(x)) 


Notemos que h(x) N h(x’) = Ø, sempre que x £ x”. Logo, f é injetora, provando o 
que queríamos. E 


Teorema 14.4 Para todos conjuntos X eY, ou X <Y ouY < X. 


Demonstração: Podemos assumir que tanto X quanto Y são não-vazios, pois, 
nesse caso, o resultado seria trivial, uma vez que qualquer conjunto domina o conjunto 
vazio. 

Supomos que X não domina Y. Pelo Lema 14.3 isso significa que não existe uma 
função sobrejetora de X em Y. Vamos mostrar que Y domina X. 

Sejam < uma relação de boa ordem sobre o conjunto X e h uma função de escolha 
em P(Y)= th). Defina uma função 


gilJr:zexp>r 


dada por 
g(s) = h(Y = im(s)). 


Notemos que s não é sobrejetora em Y, pois o domínio de s está contido em X e se 
tivéssemos im(s) = Y poderíamos facilmente estender s para uma função sobrejetora 
de X em Y, que assumimos não existir. Portanto, h está bem definida. 

Pelo teorema da recursão existe f : X — Y tal que, para todo x, 


Fa) = 9(F] 2) 


Mostremos que f é injetora. Suponha que não seja. Tome x e y em X tais que 
x tye f(x) = f(y). Como boa ordem implica ordem total, temos x < y ou y < z. 
Podemos assumir que y < x, sendo o outro caso totalmente análogo. Temos que 
y €T, contradizendo que g(f| T) & im(f| T) e f(x) = f(y). E 


Notemos o usamos o axioma da escolha duas vezes na demonstração acima: uma 
para bem ordenar o conjunto X e outra para definir a função h. O uso do axioma 
da escolha é necessário. De fato, o teorema da comparabilidade dos conjuntos é 
equivalente ao axioma da escolha, em ZF. 

O próximo lema será usado na demonstração do teorema de Cantor-Schróder- 
Bernstein. 
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Lema 14.5 (teorema do ponto fixo de Tarski) Seja F uma função de P(X) em 
P(X) tal quez C w C X implica F(z) C F(w). Então existe w C X tal que 
F(w) =w. 


Demonstração: Sendo F e X como na hipótese do lema, considere o conjunto 


A=(zeP(X):zc F(2)} 


w=[JA. 


Se z € 4, como z C F(z) ez C w, temos z C F(w). Como w = |J A isso implica 
que 


e tome 


w C F(w). 


Agora notamos que, se z E€ 4, então z C F(z) e, pela hipótese do lema, F(z) C 
F(F(z)), o que implica que F(z) € A. Em particular, F(w) € A, o que implica que 


F(w) Cw, 


provando que F(w) = w. 
E 


Teorema 14.6 (Cantor-Schróôder-Bernstein) Se X < Y eY < X então X xY. 


Demonstração: Sejam g : X —> Y e h : Y —> X funções injetoras. Mostraremos 
que existe f : X — Y bijetora. 

A ideia da demonstração é dividir X em duas partes, X, e Xz, e Y em duas 
partes, Yı e Y5, de modo que g restrita a X, seja sobrejetora em relação a Yı e h 
restrita a Y5 seja sobrejetora em relação a Yı. Em seguida, basta “colar” as funções 
g restrita a X, e a inversa de h restrita a Y>. Usaremos o teorema de ponto fixo de 
Tarski para achar as partições de X e Y. 

Usaremos a notação g|A] para denotar o conjunto im(g|A), e o mesmo também 
para a função h. 

Defina a função F : P(X) — P(X) dada por 


F(A) =X A[Y gl4]] 


Notemos que, se AC B, g|A] c 9[B]. Logo, Y = g|B|cY = g[B] e AY = g[B]| c 
h[Y = g[Bll, concluindo que F(A) c F(B). 

Logo, F satisfaz a hipótese do teorema do ponto fixo de Tarski. Tome X, C X 
tal que F(X1) = X. Defina Yı = g|Xi], X =X Xeh=YNh. 

Mostraremos que h[Y>| = X o que equivale a mostrar que 


hY N g|X:ı] =XN Xı. 
É fácil verificar que a expressão acima é equivalente a 


XNĒļN h|Y N g| X] = Xi, 
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que é exatamente a expressão F'(X) = X4, que vale pela definição de X4. 
Tomamos agora 
f = (9|X)U (Yo), 
que é claramente uma função bijetora de X em Y. 
E 


Definição 14.7 Dizemos que um conjunto X é enumerável se é equipotente a w. 
Dizemos que um conjunto é finito se é equipotente a algum número natural, e infinito 
se não é finito. 


Lema 14.8 Sejam n um número natural e X um subconjunto próprio de n. Então 
(a) X é finito; 


(b) X não domina n. 


Demonstração: Provaremos ambos os itens por indução em n. O passo inicial 
n = 0 é trivial. Suponha que o lema vale para n. Para a parte (a) não precisamos 
assumir que X Zn, pois n é equipotente a ele próprio. 

Seja X Cnt tal que X Zn”. 

Primeiro mostremos (a). Sen é X, temos que X C ne, pela hipótese de indução, 
X é finito. Sen € X, tome Y = X Nn, que será igual a X = {n}. Por hipótese 
de indução, Y é finito. Seja f:Y — m uma função bijetora, para algum m E w. 
Temos que f U ((n,m)+ é uma função bijetora de X em mt. 

Mostremos agora a parte (b). Suponhamos, por absurdo, que existe f : X — n 
sobrejetor. Provaremos que isso implica a existência de uma função sobrejetora de 
um subconjunto próprio de n em n. Vamos dividir nossa demonstração em três casos. 


+ 


Caso 1: ng X. Nesse caso, como f é sobrejetora em nt, existe m € X Nn tal que 
f(m) = n. Tome Y = {m}. Temos que Y está contido propriamente em n e f|Y é 
uma função sobrejetora de Y em n, contradizendo a hipótese indutiva. 


Caso 2: ne X e f(n) =n. Nesse caso tomamos Y = X Nn. Como X # nte 
n € X, temos que Y Zn. Mas f|Y é claramente uma função sobrejetora de Y em 
n, contradizendo a hipótese indutiva. 


Caso 3: n € X e f(n) Zn. No terceiro caso basta “trocarmos” alguns valores 
da função para reduzirmos ao caso 2. Como f é sobrejetora, existe m € n tal que 
f(m) = n. Tome 


g = (f N {(m,n), (n, f(n))}) U {(m, f(n)), (n, n)}. 


Temos que g é uma função sobrejetora de X em n* que satisfaz a condição do caso 
2, que leva a um absurdo. E 


Teorema 14.9 São equivalentes: 
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(a) X é infinito; 
(b) vu=X; 


(c) Eriste Y C X talqueY LX eY xX. 


Demonstração: Para mostrar que (a) implica (b) notemos que não existe uma 
função sobrejetora de n em X, quando X é infinito e n € w. De fato, se existisse tal 
função, pelo Lema 14.3 existiria uma função injetora de X em n, o que implica que 
X é equipotente a um subconjunto de n e, portanto, pelo Lema 14.8 item (a) e pela 
transitividade da equipotência, X é finito. 

Também notemos que n= n, em relação à ordem da inclusão. Portanto, repetindo 
a demonstração do Teorema 14.4, construímos, por recursão transfinita, uma função 
injetora de w em X. 

Para mostrar que (b) implica (c), seja f uma função injetora de w em X. Tome 
Y =X {f(0)} e considere 


g = {(f(n), f(n*)) :n E w}U{(x,2): £ E€ X ~ im(f)} 


Como f é injetora e n Æ nº é fácil verificar que g é injetora. Vimos que todo 
número natural diferente de 0 é sucessor de alguém. Portanto, o único elemento 
da imagem de f que não é da forma f(n”), para algum n € w, é f(0). Logo, g é 
sobrejetora em Y. 

Finalmente, (c) implica (a) é imediato do Lema 14.8 item (b). 

E 


O Teorema 14.9 e o Lema 14.8 dizem muito sobre a classificação dos conjunto pela 
quantidade de elementos. Pelo Lema 14.8 e pelo fato de (w, C) ser bem ordenado, 
sabemos dois números naturais diferentes nunca são equipotentes. A equivalência 
entre os itens (a) e (b) do Teorema 14.9 prova que w é infinito, e é bom ressaltar que 
isso vale em ZF, visto que as demonstrações de que (b) implica (c) e (c) implica (a) 
não usam o axioma da escolha. 

A equivalência entre os itens (a) e (b) no Teorema 14.9 nos diz que, em certo 
sentido, os conjuntos enumeráveis são os “menores infinitos” que existem. Também 
notemos que os únicos conjuntos que w domina estritamente são os finitos. 

Fica então a questão: existe algum conjunto que não seja nem finito nem enu- 
merável? Essa pergunta foi respondida por Cantor quando mostrou a não-enumerabilidade 
do conjunto dos números reais. Na verdade, com um pouquinho de trabalho em 
análise real e usando o Teorema de Cantor-Schróder-Bernstein, não é difícil mostrar 
que o conjunto dos números reais é equipotente a P(w). O mesmo argumento que 
prova que existe uma quantidade não-enumerável de números reais pode ser general- 
izada para mostrar que o conjunto das partes de X é sempre estritamente maior que 
X, como enunciamos a seguir. Reparem a semelhança do argumento utilizado por 
Cantor com o Paradoxo de Russell. 


Teorema 14.10 (Cantor) O conjunto P(X) domina estritamente X. 
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Demonstração: A função que associa x € X a {x} € P(X) é injetora, pelo axioma 
da extensão, e prova que P(X) domina X. Provaremos que X não domina P(X), 
mostrando que não existe função sobrejetora de X em P(X), o que é suficiente, pelo 
Lema 14.3. 

Seja f uma função de X em P(X). Considere 


Z=(xeX:xgf(x)) 


Vamos mostrar que Z & im(f). 

Suponha que existe z E€ X tal que f(z) = Z. Se z € Z então, por definição, 
z é f(z), o que significa que z É Z. Se z É Z isso significa que z É f(z), o que 
implica que z € Z. Chegamos, assim, numa contradição. E 


A pergunta natural a fazer depois de vermos o enunciado do Teorema de Cantor é 
sobre a existência de alguma coisa intermediária entre w e P(w), ou, mais geralmente, 
entre X e P(X). Essa conjectura de que não existe nada entre w e P(w) é conhecida 
como hipótese do contínuo e foi colocada por Hilbert no topo dos problemas mais 
importantes na virada do século XIX para o século XX. 


Hipótese do contínuo: Se w < X e X = P(w) então X é equipo- 
tente a w ou a P(w). 


Esse problema foi provado ser independente de ZFC, isto é, não pode ser provado 
nem refutado utilizando os axiomas usuais de teoria dos conjuntos. Pelo teorema da 
completude da lógica de primeira ordem, isso significa que existem um modelo para 
teoria dos conjuntos que satisfaz os axiomas de ZFC e a hipótese do contínuo, e outro 
modelo para teoria dos conjuntos que satisfaz os axiomas de ZFC e a negação da 
hipótese do contínuo. 

Como dissemos, o problema foi postado por Hilbert em 1900 na sua famosa lista 
dos 22 problemas mais importantes do século XIX. A consistência da hipótese do 
contínuo só foi mostrada em 1940 por Kurt Gödel, e a consistência da negação da 
hipótese do contínuo foi provada em 1964 por Paul Cohen. 

A seguinte generalização da hipótese do contínuo também foi provada ser inde- 
pendente de ZFC. 


Hipótese generalizado do contínuo: Se X < Y e Y < P(X) então 
Y é equipotente a X ou a P(X). 


Exercícios 


1. Mostre que um conjunto X é infinito se, e somente se, existe uma boa ordem em 
X em relação a qual X não possui máximo. 


2. Prove que, se X é enumerável então X x X é enumerável (pode usar, sem demon- 
strar, fatos básicos de aritmética). 


3. Prove que a união e a intersecção de conjuntos finitos são finitas. 


4. Prove que um subconjunto de um conjunto finito é finito. 


5. Prove que P(X) é finito se, e somente se, X é finito. 
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CAPÍTULO 14. CONJUNTOS EQUIPOTENTES 


Capítulo 15 


Axioma da substituição 


Após essa discussão sobre boa ordem e conjuntos equipotentes, feita nos capítulos 
anteriores, o próximo passo será falar sobre ordinais e cardinais. Mas, antes, pre- 
cisamos enunciar o último axioma de ZFC que falta, que é, na verdade, assim como 
o axioma da separação, um esquema de axiomas. 


Axioma 10 (da substituição) Seja P(x,y) uma fórmua e suponha que, para todo 
z,y,z temos que P(x,y) e P(x,2) implicam y = z. Então, para todo conjunto X, 
existe o conjunto 


(y:dr(x e X A P(z,y)}. 


A condição sobre a fórmula P diz que, para todo x, existe no máximo um y para 
o qual P(x,y) vale. Ou seja, P exerce o papel de uma função parcial em X, e o 
axioma da substituição garante que existe a imagem dessa “função”. 

Para simplificar a notação, introduzimos alguns símbolos lógicos que serão uti- 
lizados neste capítulo. O símbolo 7 significa “existe no máximo um” e é definido da 
seguinte forma: 


TP = Yy(P} > (z£ = y)) 
O símbolo 4! significa “existe um único” e é definido como 


JlxP = (Az P) A (F'xP) 


LU 


Formalmente, utilizando essa notação, o esquema de axiomas da substituição diz 
que para toda fórmula P em que v não ocorre livre a seguinte fórmula é um axioma: 


vYz3yP > VXIvVyl(yev) > Jr(x € X A P)) 


O motivo da restrição de v não ocorrer livre em P é o mesmo que foi discutido no 
axioma da separação: reservamos a variável v para definir o conjunto que o axioma 
constrói, e a ocorrência livre de v em P poderia resultar em um paradoxo. 

Poderíamos suprimir o axioma da separação da lista de axiomas de ZFC, e prová- 
lo como teorema, a partir do axioma da substituição. Para isso basta tomarmos a 
fórmula P(x) A (x = y), escolhendo y uma variável que não ocorre livre em P (lem- 
brando que, utilizando os axiomas lógicos, é sempre possível substituirmos uniforme- 
mente as variáveis livres de uma fórmula). O axioma da separação nos garante que 
existe o conjunto 


{y : Je(x E X A P(x) A(z = y)b, 
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o que coincide com o conjunto 
(re X: P(x)h 


O axioma da substituição permite formularmos uma nova versão do teorema 
da recursão (vide 12.2). Vimos que a recursão transfinita permite definirmos uma 
função em um conjunto bem ordenado X de modo que o valor de tal função em x 
dependa do valor da função nos elementos menores que x. Porém, na forma como 
está enunciado o Teorema 12.2, precisamos ter um controle sobre o contradomínio de 
f (que, nesse enunciado, é chamado de Y). No entanto, em algumas aplicações, isso 
não será possível, e nisso entra o axioma da substituição. 

Alguns livros enunciam o teorema da recursão tomando Y uma classe em vez de 
conjunto (por exemplo, a classe de todos os conjuntos, a classe do todos os ordinais). 
Dessa forma, a função g, conforme consta no enunciado do teorema da recursão 
aqui apresentado, também pode ser uma classe própria. Como estamos trabalhando 
em ZFC, apesar de falarmos intuitivamente sobre classes de conjuntos, precisamos 
formalizar melhor esse processo, substituindo classes por fórmulas. 

Por esse motivo, chamaremos o teorema seguinte de “teorema da recursão trans- 
finita para classes”. 


Teorema 15.1 (recursão transfinita) Seja F(x,y) uma fórmula tal que VxdlyF (x,y) 
seja verdadeira. Seja (X, <) um conjunto bem-ordenado. Existe uma única função f 
cujo domínio é X e que satisfaz, para todo x E X, 


F(f| z, f(x) 
Demonstração: Considere G(x, f) a seguinte fórmula: 
(z € X) A (f é função) A (dom(f) = U{2}) A Yyly < z = F(F| Y, f())) 


Afirmação 1: Para todo x € X, se valem G(x, f) e G(x, g) então 
f =g. 


Provemos a afirmação 1 por indução em x. Suponha que a afirmação vale para 
todo y Ex. Se G(x, f) e G(x, g) são verdadeiras, está claro, pela definição de G(x, f), 


que G(y, FI U{y})) e G(y, g| U{y})) também valem, para todo y < x. Logo, pela 
hipótese de indução, temos, para todo y < zx. 


FIO ULy) = g Uiu} 


Em particular, f(y) = g(y), para todo y ET. 
Portanto, das hipóteses G(x, f) e G(x, g) seguem que 


PUE Rato), 


o que implica, pela hipótese sobre F(x,y), que f(x) = g(x), concluindo que f = g. 
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Afirmação 2: Para todos x,y € X, se y < x e valem G(x, f) e 
Gly, 9), então f|(Y U{y}) = g. 
Nessas hipóteses, está claro, pela definição de G, que G(y, fl(z U{x}) é ver- 
dadeira. Portanto, da afirmação 1 segue que f|(x Ulx)) = g. 
Afirmação 3: Para todo x € X existe f tal que G(x, f). 


Suponha, por indução transfinita, que a afirmação seja verdadeira para todo 
y <x. Considere o conjunto 


Z = {g : Jyly ex AG(y,9))) 
A existência do conjunto Z é assegurada pelo axioma da substituição, lembrando que 
a afirmação 1 nos grante que G satisfaz as hipóteses do axioma da substituição. 


As afirmações 2 e 3 provam que |] Z é uma função cujo domínio é T. 

Pela condição sobre F, sabemos que existe um único t tal que F(U Z, t) é ver- 
dadeira. 

Defina 


f= U2) u{z,)} 
Como f| t= UZ e t= f(x), está claro que 
F(f| z, f(x) 


Pela definição de Z e pela afirmação 2 temos que G(y, f| y U{y}) vale, para todo 
y ET. 
Em particular, para todo y ET temos 


Ff 9, f(y)) 


o que conclui a afirmação. 


Se (X,<) possui máximo, então as afirmações 1 e 3 já provam o teorema, pois 
basta tomar f a única função tal que G(x, f) é verdadeira, onde x é o máximo de 
X. Se não possui máximo, temos duas maneiras de encerrar a prova. A primeira, 
repetimos o argumento usado na afirmação 3, usando o axioma da substituição para 
definir como f a união de todas as funções g que satisfazem G(x,9), para algum 
EA: 

Outra maneira é acrescentarmos um máximo ao conjunto (X, <), obtendo um 
conjunto bem-ordenado (X',<" onde X’ = X U {x'} e x <' x' para todo q € X. 
Como mostramos que existe uma única f tal que G(x”, f) vale, é fácil ver que f|X 
satisfaz as condições do teorema 

E 


Uma das aplicações do Teorema 15.1 é a definição do fecho transitivo de um 
conjunto. Dizemos que y é o fecho transitivo de x se y é transitivo, x está contido 
em y e, para qualquer conjunto transitivo z, sex C z então y C z. Ou seja, o fecho 
transitivo de x é o menor conjunto transitivo que contém y. Está claro que o fecho 
transtivio, quando existe, é único. A existência segue do teorema anterior. 


Corolário 15.2 Para todo x existe o fecho transitivo de y. 
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Demonstração: Usando o Teorema 15.1, defina f de domínio w tal que f(0) = x 
e f(nt) = U f(n). Deixamos como exercício ao leitor completar os detalhes da 
demonstração da existência da função f, utilizando uma fórmula F adequada. Basta 
lembrar que, para provar a recursão finita (como é utilizada aqui) a partir da recursão 
transfinita, usamos o fato de que todo número natural diferente de O é sucessor de 
alguém. 

Tome y = Jim(f). Mostraremos que y é o fecho transitivo de x. 

Está claro que x C y, pois x € im(f). Se z E y, existe n € w tal que z € f(n). 
Logo, z C U f(n) = f(nt). Portanto, z C y. 

Agora suponha que existe um conjunto transitivo z tal que x C z. Vamos mostrar 
que y C z. Para isso, basta mostrar que f(n) C z, para todo n € w. Mas notemos 
que, pela transitividade, se w C z temos [Jw € z. Assim, como x C z, por indução 
provamos que f(n) C z, para todo n € w. 

E 


Exercícios 


1. Prove a existência de um conjunto indutivo ao qual w pertence. Discuta o uso 
do axioma da substituição. 


2. Enuncie o princípio da recursão finita para classes, e demonstre-o a partir do 
princípio da recursão transfinita. 


3. Dê um exemplo de um conjunto transitivo infinito que não contém w como sub- 
conjunto. Justifique sua resposta. 


4. 


Capítulo 16 


Ordinais 


Dentre os conjuntos bem-ordenados que vimos até agora, podemos notar que o con- 
junto w, ordenado com a inclusão, possui propriedades bastante especiais, opera- 
cionalmente úteis. Primeiro porque w é transitivo, isto é, todos seus elementos são 
também subconjuntos de w. Segundo porque a relação de pertinência coincide com 
a inclusão própria. Isso implica que n (o conjunto dos elementos menores que n) 
coincide com o próprio conjunto n, o que frequentemente facilita a notação, como no 
caso do teorema da recursão. 

Observamos que os elementos de w satisfazem essas mesmas propriedades, e o 
mesmo vale para wt (lembrando que w? é o conjunto w U {w}, que também é bem- 
ordenado pela inclusão. Podemos construir outros desses “conjuntos bem-ordenados 
especiais” tomando (wt)*, ((wt)t)t e assim por diante. O próximo passo seria 
tomar a união de todos esses “sucessores” de w, mas isso exige uma atenção maior, e 
é justamente nesse ponto que entra o uso do axioma da substituição, como veremos 
em breve. 

Esses conjuntos que são transitivos e bem-ordenados com a relação de pertinência 
são chamados de ordinais, e costumam ser representados por letras gregas. 


Definição 16.1 Dizemos que um conjunto a é um ordinal se satisfaz as seguintes 
condições: 


e se 8 € a então 8 C a (a é transitivo); 


e a relação {(x,y) cal: (x € y) V (x = y)} é uma boa ordem em a (a é 
bem-ordenado pela pertinência). 


Do Teorema 11.6 segue imediatamente o seguinte resultado: 
Lema 16.2 w é um ordinal. 


Sempre quando falarmos de um ordinal estamos nos referindo, implicitamente, 
da ordem dada na definição, que, como veremos pelos itens (a) e (c) do próximo 
teorema, coincide com a ordem da inclusão. 

Do lema anterior e do item (a) do teorema seguinte segue que os números naturais, 
são, eles próprios, ordinais. 
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Teorema 16.3 Seja a um ordinal. 

(a) Se B ea então B é um ordinal; 

(b) at é um ordinal; 

(c) Se 8 Ca, +a ep étransitivo, então BE a; 


(d) Se B €a então Bt €a ou pT =a. 


Demonstração: Seja 8 € a. Pela transitividade de a, temos 8 C a e, portanto, 5 
é bem-ordenado pela pertinência. 

Vamos mostrar que 8 é transitivo. Sejam y € B e ô € y. Pela transitividade de 
a temos y Ea ed Ea. Pela boa ordem de a temos ô € 8 ou ô = 8 ou 8 € ô. Mas as 
duas últimas possibilidades contradizem o axioma da regularidade, sobrando, então, 
que ô € p. 

Concluímos, assim, a prova de (a). Provemos (b). Primeiro vejamos que a” é 
transitivo. De fato, se 8 € at, então BE a ou 8 = a. Em ambos os casos (usando a 
transitividade de a no primeiro) temos 8 C a. Mas a C at, concluindo que 8 C a”. 

Agora mostraremos que a* é bem ordenado pela pertinência. Seja A C a™ não- 
vazio. Se A = {qa}, então claramente a é o mínimo de 4. Senão, AN a é não-vazio e 
está contido em a. Seja 5 o mínimo de AN a. Temos que 5 € a, logo, O é o mínimo 
também de 4. 

Provemos o item (c). Seja y o mínimo do conjunto {x € a: x É B}, que é 
não-vazio pela hipótese 8 £ a. Mostraremos que y = 8. De fato, se ô € y, então, 
pela transitividade de a, ô E€ q. Mas, pela definição de y, isso significa que y € 5, 
pois y é menor (na ordem da pertinência) que o mínimo dos elementos de a que não 
pertencem a f. 

Reciprocamente, se à € 5, como 5 C a, temos que à E€ a. Como a é bem- 
ordenado, temos que ô € y ou ô = y ou y E€ ô. Mas, se ô = y ou y E ô, pela 
transitividade de 8 isso implica que y € 8, contradizendo a definição de y. 

Isso prova que 8 = y e, portanto, 8 € a, provando o item (c). 

O item (d) segue facilmente dos itens anteriores. De fato, se 8 € a, pela transi- 
tividade de a temos que 8 C a e, portanto, 6t C a. Pelo item (a), 8 é um ordinal, e, 
por (b), 6t também é um ordinal. Em particular, 9* é transitivo. Logo, se 8T £a, 
do item (c) segue que pT € a. 

E 


O Teorema 16.3, especialmente os itens (b) e (d), motiva a seguinte definição: 


Definição 16.4 Dizemos que um ordinal a é um ordinal sucessor se existe 5 tal que 
a = B+. Caso contrário, dizemos que a é um ordinal limite. 


Do Teorema 16.3, item (d), segue que a é um ordinal limite se, e somente se, 
Bt € a, sempre que 8 € a. 


Teorema 16.5 Para todos ordinais a e B temosa E B,a=Boubea. 
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Demonstração: Primeiro provaremos que a N 5 é um ordinal. Para isso basta ver 
que a N 8 é transitivo, pois ser bem-ordenado pela pertinência segue de a N 8 ca. 
Se y E aN p então, pela transitividade de a e 8 temos y Ca ey C 8, o que implica 
que ycang. 

ComoaNßb CaeaNgB c 8, do Teorema 16.3, item (c), segue que, sean 8 
não for igual a a ou a 8 temosaN b EaeaNb Eep. Nesse caso, aN b EaN P, 
contradizendo o axioma da regularidade. 

Se aN 8 = q, isso significa que « C 8, o que implica, pelo Teorema 16.3 item (c), 
que a E€ 8 ou a = p. Se aN 8 = 8, temos que 8 C a e, portanto, 8 € a ou 8 = a, 
concluindo a prova do teorema. 


Corolário 16.6 Um ordinal a é infinito se, e somente se, a =w ouw Ea. 


Demonstração: Sew E€ Q então w C œ. Logo, como subconjunto de conjunto 
finito é finito (consequência do Lema 14.8) e w é infinito, temos que a é infinito. 

Reciprocamente, se a é infinito então a É w. Pelo Teorema 16.5 isso implica que 
a =w ou w E a, provando o corolário. 


Teorema 16.7 Se A é um conjunto de ordinais então [JA é um ordinal. 


Demonstração: Mostremos que [J A é transitivo. Seja x € [J A. Isso significa que 
existe a € A tal que x € a. Mas, como, por hipótese, a é transitivo, temos que x C a 
e, portanto, como a C | A, temos z C |J A. 

Falta provar que |J 4 é bem ordenado pela pertinência. Seja S C |J A não-vazio. 
Tome a € A tal que S Na # ý. Como a é bem-ordenado pela pertinência, existe 
y E S Na tal que y € ô, para todo å € SN a diferente de y. 

Seja 6 € S. Pelo Teorema 16.5 temos que 8 € a, 6 = a ou a € 8. No primeiro e 
segundo caso temos y € 8 ou y = 8 pela minimalidade de y em SN a. No segundo 
caso, temos y € beta, pois y E€ a. No terceiro caso, de y E€ a e a € 8 segue que 
y € 8, pela transitividade de 8. 

Logo, 8 é o mínimo de S, provando que |J A é bem-ordenado. E 


Corolário 16.8 Não existe o conjunto de todos os ordinais. 


Demonstração: Suponha que exista A o conjunto de todos os ordinais. Tome 
a = |J A, que é ordinal, pelo Teorema 16.7. Pelo Teorema 16.3 temos que at é um 
ordinal, logo at € A. Como a € at, temos a E |J A. Logo, a € a, contradizendo o 
axioma da regularidade. E 


Corolário 16.9 Um conjunto transitivo de ordinais é um ordinal. 
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Demonstração: Seja X um conjunto transitivo formado por ordinais. Mostraremos 
que X é bem-ordenado pela relação de pertinência. 

Pela transitividade de X temos que |J X C X e, pelo Teorema 16.7, JX é 
bem-ordenado pela pertinência. 

Mostremos que X = UJ X é vazio ou unitário. De fato, suponha que existem x e 
y distintos que pertencem a X mas não pertencem a |J X, pelo Teorema 16.5 temos 
xz eyouy ex. Mas x E y implica que rx € UX, e y € x implica que ye UX, 
contradizendo que ambos não pertencem a |J X. 

Isso também mostra que, sex € X = [J X, então y € x, para todo ye [J X. 

Portanto, se existe x € XN[JX, temos que X = U X U{zx}, que é bem-ordenado 
pela pertinência, sendo x seu elemento máximo. Se não existe x € X = U X, temos 
que X = [J X, que é um ordinal e, portanto, é bem-ordenado. E 


Falaremos agora sobre isomorfismos de ordem e de ordinais. Começamos provando 
que ordinais diferentes não são isomorfos. 


Lema 16.10 Seja f um isomorfismo entre dois ordinais a e B. Entãoa=B ef é 
a identidade. 


Demonstração: Seja f : a — p um isomorfismo de ordem. Podemos assumir que 
a < 5, já que a existência de um isomorfismo de a em 5 é equivalente à existência de 
um isomorfismo de 8 em a. Provamos, por indução, que f(y) = y, para todo y € a. 
De fato, se isso não for verdade, seja y o menor elemento de a tal que f(y) Æ 7. 
Temos que f(y) < y ou f(y) > 9. 

No primeiro caso, por hipótese, teríamos f(f(y)) = f(y), contradizendo que f é 
injetora. 

No segundo caso, como f é sobrejetora, existe y € a tal que f(y) = y. Mas, 
pela hipótese, não podemos ter y~! < y, pois teríamos f(y) = y. Logo, y < y e 
F(y) < f(y), contradizendo que f é um isomorfismo de ordem. 

Concluímos, portanto, que f é a identidade e que, portanto, a = 5. E 


O próximo teorema é uma das principais aplicações do axioma da substituição, 
e mostra que toda boa-ordem pode ser representada por um ordinal. 


Teorema 16.11 (Princípio da contagem) Para todo conjunto bem-ordenado (X, <) 
existe um único ordinal a tal que (a, C) é isomorfo a (X, <). 


Demonstração: A unicidade segue do Lema 16.10, uma vez que composição e 
inversa de isomorfismos são isomorfismos e, portanto, se um mesmo conjunto bem- 
ordenado for igual a dois ordinais, eles serão isomorfos entre si e, consequentemente, 
iguais. Mostraremos a existência, usando o Teorema da Recursão Transfinita (versão 
para classes). 

Seja F(f,a) a fórmula 


((f é função) > (a = im(f))) A ((f não é função) > (a = Ø)) 
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Está claro que para todo f existe um único a tal que F(f,a). Portanto, podemos 
usar o Teorema 15.1 para determinar uma função f com domínio X tal que, para 
todo x € X, 


a. 
F(F| x, f(x)) 
Mostraremos que f é um isomorfismo de X em sua imagem, e que a imagem de 
f é um ordinal. 
A ideia da construção dessa função f através da fórmula F lembra o conceito 
intuitivo de ordinal, como “conjunto dos ordinais menores do que ele”. 


Afirmação 1: Para todo x € X, f(x) é um ordinal. 


Provaremos essa afirmação por indução em x. Pelo Corolário 16.9 basta mostrar- 
mos que f(x) é transitivo. 

Sejam z € f(x) e w € z. Como f(x) = im(f| 2), existe y < x tal que z € f(y). 
Pela hipótese de indução, f(y) é ordinal e, portanto, transitivo. Logo w € f(y). Mas, 


como f(y) = im(f| y), temos que f(y) C f(x), provando que w e f(x). 
Afirmação 2: A imagem de f é um ordinal. 


Pela afirmação 1, im(f) é um conjunto de ordinais. Analogamente à prova da 
afirmação 1, podemos mostrar que im(f) é transitiva e, portanto, um ordinal. 


Afirmação 3: A função f é um isomorfismo de X em sua imagem. 


Se y < x, então f(y) € im(f| T) e, portanto, f(y) € f(x). Reciprocamente, se 
f(y) € f(x), isso implica que f(y) # f(x) e que f(x) É f(y), o que não permite 
que tenhamos x < y. Como boas ordens são também ordens totais, isso implica que 
y < x. Disso segue também a injetividade de f, e a sobrejetividade é imediata, pois 
estamos considerando f em relação à sua imagem. Isso conclui o teorema. 


Exercícios 


1. Considere a seguinte sentença: existe um conjunto bem-ordenado que não possui 
máximo. Prove que, mediante os demais axiomas de ZFC, essa sentença é equivalente 
ao axioma da infinidade. Discuta se essa equivalência vale também em ZF. 


2. Prove que são equivalentes, para um ordinal a: 
(a) a é um ordinal limite; 

(b) a não possui máximo; 

(c) a =a; 

(d) Ua €a. 
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3. Se a é um ordinal sucessor, prove que a = (U a)”. 
4. Para todo ordinal a, prove que existe um ordinal limite 5 tal que a € 5. 


5. Em ZF, prove que o axioma da escolha é equivalente à seguinte sentença: todo 
conjunto é equipotente a algum ordinal. 


Capítulo 17 


Aritmética ordinal 


A aritmética de números ordinais estende a definição de aritmética de números in- 
teiros. A diferença fundamental é que, enquanto nos números inteiros, precisamos 
apenas definir as operações para nº uma vez que essas estão definidas para n, na 
aritmética ordinal precisamos cuidar dos ordinais limites. 


Soma de ordinais 


Iniciamos com a definição de soma de números ordinais. Mas antes, vamos estabelecer 
uma notação. Se A é um conjunto de ordinais, chamamos de supremo de A — que 
será denotado por supÁ — o menor ordinal que é maior ou igual a todo elemento de 
A. É fácil verificar que o supremo de A sempre existe e é igual a |J A. Preferimos, 
no entanto, em algumas ocasiões, a notação supA quando essa condizer melhor com 
o contexto utilizado no momento. Particularmente, quando estamos interessados 
mais na estrutura de ordem dos ordinais do que da sua construção conjuntística. 
Ou seja, embora a € B e a < 5 representem a mesma coisa, quando se trata de 
ordinais preferimos a notação < quando não nos preocupamos em relembrar a forma 
como foram construídos os ordinais. Nessa mesma ocasião, preferimos a notação do 
supremo à da união. 


Definição 17.1 Dados dois ordinais œ e 8 definimos a soma a + 5 através das 
seguintes regras: 


e a+0=a. 


Ea br. 
e Se 8 é ordinal limite, então a + 8 = supa +y: y < Bh. 


Discutiremos aqui a definição acima, que claramente carece de melhores justi- 
ficativas. Primeiro notamos que, como não existe o conjunto de todos os ordinais, a 
soma de ordinais não pode ser considerada uma função, como no caso dos números 
naturais. Em vez disso, deve ser pensada como mais um símbolo funcional binário 
ou, mais precisamente, como uma fórmula de três variáveis livres que diz “x,y e z 
são ordinais tais que z é a soma de x e y”. 
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Usando o recursão transfinita podemos provar que existe uma fórmula F(x,y, z) 
satisfazendo as condições dessa definição, sendo x e y ordinais e z a soma de x e 
y. Mais do que isso, provamos que a cada x e y ordinais existe um único ordinal 
z tal que F(x,y,z) é verdadeira, e que a fórmula F é única, no sentido de que, se 
F'(x,y,2) também satisfaz a definição, então vale F(x,y, z) — F'(x,y,2). 

Vamos formalizar a definição de F(x,y,z). Para cada a e 8 ordinais, pelo Teo- 
rema 15.1 existe uma única única função 


fa: pr E im( fa) 


satisfazendo 
Gla ala) 


para cada y < Bt, onde G(f,y) é a fórmula dada pelas seguintes condições: 
e Se dom(f) = 0 então y = a. 
e Se dom(f) = dt então y = (f(8))*. 
e Se dom(f) é um ordinal limite ô, então y = supi f(E) : E< ô}. 
Definimos a + 8 como fal 8). Deixamos os detalhes por conta do leitor. 
Lema 17.2 Para todos ordinais a, 8 e y valem 


(a) a+1l=a?; 


(b) y+8<y+a se, e somente se, 8 < a; 

(e) (a) sao: 

(d) Se B <a então existe um único ordinal E tal que B + £= a; 

(e) Existe um único ordinal limite ô e um único natural n E w tais que a = ô+ n. 

Demonstração: O item (a) é imediato, pois a + 1 = a +0* = (a +0)* = at. 
Para o item (b) mostraremos por indução em a que 8 < a implicay+5 < y +a. 


Para a = 0 é trivial. Suponha que a implicação vale para a e todo 8 < a. SeB < at, 
temos duas opções: B < a ou B = a. Se 8 <a, pela hipótese indutiva temos 


y+B<yta<(y+a)t=y+af 


Agora assumimos que 5 é um ordinal limite e que a afirmação vale para todo ô < a. 
Seja 8 < a. Como a é limite, 8* < a. Portanto, pela hipótese indutiva, 


y+b<y+B!<suply+ô:di<al=9+a 


A recíproca do que acabamos de mostrar, conforme consta no enunciado do item 
(b), segue da comparabilidade dos ordinais. Se y + 8 < y+ a, obviamente não 
podemos ter a = 3. Logo, se não vale 8 < a, vale a < 8, o que, segundo mostramos, 
implica que y + a < y + 8, contradizendo que a desigualdade inversa vale. 
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Mostremos o item (c) por indução em y. Se a associatividade vale para um y 
fixo, e todos a e 8, temos 


a+(8+y)=a+(8+9)* = (0 +(8+49))* = (a +8) +59)" 


SUERO Pa) = EEU o = ace) 


Para o caso limite, suponha, por hipótese indutiva, que (a +5) +60 =a+(8-+6), 
para todos a e 8 e todo ô < y, onde y é um ordinal limite. Temos que 


(a+ b)+y = sup{(a + 8) +8: 8 <y} = supa + (8+8): <7} 
Para concluir o item (c) basta mostrarmos que 


(x) sup{a + (8 +8): < 7y} = supa +E:E< 8+7} 


uma vez que a expressão do lado direito é, por definição, a + (5 + 7). 

Para mostrar (x) basta mostrar que cada elemento de um dos dois conjuntos é 
limitado por um elemento do outro. Se é = 8 +, para ô < y, então, pelo item (b), 
E< 8 +, o que mostra que o supremo do lado esquerdo, em (x), é menor que o do 
lado direito. Por outro lado, se € < 5 + y, como y é limite, temos que existe ô < y 
tal que é < 5+6. Logo, pelo item (b), a+€ < a+(8+6), provando (x) e concluindo 
o item (c). 

O item (d) será provado por indução em a. Suponha que o item (d) vale para a 
e todo 3 <a. Seja 8 < at. Se B = a, pelo item (a) temos a = 8 +1. Se 8 <a, 
temos, pela hipótese de indução, que existe £ tal que 8 + E = a. Logo, 8 + Et = a”. 

Suponha agora que a é um ordinal limite e que, para todos B < ô < a, existe 
um único ņ tal que 8 +n = ô. Deixamos como exercício ao leitor provar que m < ô. 
Defina 


E = sup{n: 86 +N <a} 


Primeiro notemos que é é um ordinal limite. De fato, se € fosse um ordinal sucessor, 

é seria o maior ordinal tal que 5 + E < a, absurdo, pois, pelo fato de a ser ordinal 

limite, 6+7 = (8 +60)! < a. Também é imediato que £ 0, uma vez que 8+1 < a. 
Mostraremos que 


(xx) B+é=a 


Para mostrar isso, seja ô < 8 +, isso significa que existem” < E tal que ô < 5 + n. 
Pela definição de é, existem < E tal quem <neB+n<a. Pelo item (b), 6 < 8 +n 
e, portanto, à < a. 

Reciprocamente, suponha que ô < œ. Se ô < B, temos ô < B + £, já que € # 0. 
Se 5 < ô, pela hipótese indutiva existe ņ tal que 6 +N = ô, o que significa que m < £ 
e, portanto, 6 +n< B+é. 

Isso prova que 8 + E= a. A unicidade de £ é imediata do item (b). 

Resta mostrarmos o item (e). Defina 


ô = suplm < a : ņ é ordinal limite | 
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Claramente ô < a. Se ô = a, temos que ô + 0 = a, o que satisfaz o item (e). Se 
ô < a, existe um único ordinal n tal que ô + n = a. Vamos provar que n E w. 

Se n É w, temos n = w ouw < n. Em ambos casos temos ô +w < +n = q, 
pelo item (b). Como ô < +w e +w é um ordinal limite (verifique!), isso contradiz 
a definição de ô como supremo dos ordinais limites menores que a. 

Para a unicidade, suponha que a = ð + m, onde ð é um ordinal limite e m € w. 
Vamos provar que ô = 6”, isto é, ð? também é o supremo dos ordinais limites menores 
ou iguais a a. De fato, está claro que ð < a. Seja ņn um ordinal limite tal que 6' < n. 
Mostraremos que a < n. Para isso, basta mostrarmos por indução que 6' + k < n, 
para todo k € w. Para k = 0 temos 9 +0 = 8 <n. Sed'+k <n, temos que 
9 + kt = (6'+ k)", que é estritamente menor que mn, uma vez que n é um ordinal 
limite. Portanto, a < ņ e ð = ô. 

Pelo item (b) é imediato que m = n, concluindo a prova do item (e). E 


Notemos que a soma de ordinais não é comutativa. Temos, por exemplo, 2+w = 
w, que é diferente de w + 2. 

Pelo item (b) do lema e pela propriedade de comparabilidade dos ordinais, vale 
a lei do cancelamento à esquerda, ou seja, se y + 8 = y + a então 8 = a. Observe 
que, pelo exemplo dado no parágrafo acima, sabemos que não vale o cancelamento à 
direita. Em particular, o item (b) não vale se y estiver à direita de 8 e a. 

O item (d) nos fornece uma espécie de subtração de ordinais, enquanto o item (e) 
nos permite decompor qualquer ordinal de uma forma interessante, que nos ajuda não 
apenas a compreender a noção intuitiva de ordinais, mas também é útil em algumas 
demonstrações, como veremos posteriormente. 

O próximo teorema nos dá uma caracterização bastante interessante de soma de 
ordinais. 


Teorema 17.3 Sejam (X1,<1) e (X2, <2) dois conjuntos bem-ordenados isomorfos 
aos ordinais a e B, respectivamente. Suponha que Xı NX, = (0 e considere X = 
X, U Xə ordenado com os elementos de X, antes dos elementos de Xə. Isto é, 
definimos em X a ordem 

<=<, U <2 UX, x X2 


Então (X,<) é isomorfo a a + B. 


Demonstração: Vamos provar o teorema por indução em 5. Para 5 = 0 é trivial, 
pois teremos Xə = Ø. Suponha que, para um determinado 8, o teorema vale para 
qualquer (X1, <1) isomorfo a algum ordinal a e qualquer (X2, <2) isomorfo a 8. 
Sejam (X1, <1) e (X2, <>) isomorfos a a e Bt, respectivamente. Isso significa que X> 
possui um máximo y e, se tomarmos, X4 = Xə = {y}, temos que X; é isomorfo a £. 
Pela hipótese de indução, Xı U X; é isomorfo a a + 8. Mas y é claramente o máximo 
de X, U X>, que é, portanto, isomorfo a (a + 5)*, que é igual a a + 57. 

Para o caso ô limite, supomos que o teorema vale sempre que X, é isomorfo a 
algum ordinal a e Xə é isomorfo a algum ordinal y < 5. 

Seja ô o único ordinal isomorfo a X, U X> com a ordem acima descrita (que é 
claramente uma boa ordem). Seja f o isomorfismo entre X,U Xə e ô. 
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Como ĝ é limite, X2 não tem máximo. Logo, ô é um ordinal limite. Para cada 
x E€ Xə, a restrição de f a XU T é um isomorfismo sobre f(x). Pela hipótese indutiva 
e pelo Lema 16.10 temos f(x) = a +, onde y < 8 é isomorfo a x. Logo, 


ô = supa +y: y< b}=a+8, 


provando o teorema. E 


Multiplicação de ordinais 


Agora definiremos a multiplicação de ordinais e, desta vez, deixamos a formalização 
por conta do leitor. 


Definição 17.4 Dados dois ordinais a e 5 definimos o produto a - 5 através das 
seguintes regras: 


e a-0=0. 
ca (B)=(a-Bj+a. 
e Se 8 é ordinal limite, então a - 8 = supfa -y : y < Bh. 


Como de costume, denotamos o produto a - 5 por aß. Para vários resultados 
do Lema 17.2 vale algo similar na multiplicação de ordinais. Verificaremos o análogo 
para multiplicação do item (b) do Lema 17.2. 


Lema 17.5 Sey #0 eß <a então yb < ya. 


Demonstração: Provaremos por indução em a. Para a = 0 o lema vale por 
vacuidade. Suponha que o lema é verdadeiro para a. Seja 8 < a*t. Temos 8 < a. 
Por hipótese de indução, 


yB < ya < ya +y = yat. 


Seja œa um ordinal limite e suponha que o lema vale para todo ô < a, no lugar de 
a. Seja 8 < a. Temos que 8* <a e, portanto, 


yB<yB+Y=9B! < supf yE: E <a} = ya 


E 

Se, por um lado, a soma de ordinais representa a união disjunta de conjuntos 

bem-ordenados, a multiplicação representa o produto cartesiano, com a ordem an- 
tilexicográfica, conforme o seguinte teorema. 


Teorema 17.6 Sejam (X,<1) e (Y, <2) conjuntos bem-ordenados isomorfos a a e 
B, respectivamente. Considere X x Y ordenado pela ordem antilexicográfica, isto é, 


(x,y) < (x,y) — (y <2 Y V (y =y ^T < a). 


Então (X x Y, <) é isomorfo a aß. 
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Demonstração: Podemos assumir que X e Y são os próprios ordinais a e 5. 
Também assumimos que nenhum deles é o ordinal 0, visto que, nesse caso, a x 5 
e aß são ambos o conjunto vazio. Provaremos por indução em 8 que a x 8, com a 
ordem antilexicográfica, é isomorfo a aĝ. 

Defina uma função f de domínio a x 5 como 


F(E n) = (an) + 6 


Como fazemos com os números naturais, escreveremos simplesmente am + É no 
lugar de (an) + £. 


Afirmação 1: f é um isomorfismo sobre a imagem. 


Suponha que (€,n) < (€',7') na ordem antilexicográfica. Mostraremos que am + 
é an +E. 

Temos dois casos. No primeiro, n=7' e E < &, o que implica imediatamente, 
pelo Lema 17.2 item (b), que £ < €". 

Vamos analisar o caso em que n < n’. Pelos Lema 17.2 item (b) e pelo Lema 17.5 
temos 


aonté<anta=-an!<am < an +€. 
Afirmação 2: A imagem de f é aß. 


Provaremos a afirmação por indução em 8. Suponha que 8 =! e que f restrita 
a a x y é sobrejetora em ay. 

Seja ô < aß. Se ô < ay, pela hipótese indutiva existe (£,7) E€ a x y tal que 
ô = am + é, provando que ô pertence à imagem de f. Se ay < ĝ, pelo item (d) do 
Lema 17.2 existe £ (possivelmente 0) tal que ô = ay + £. Como ô < aß = ay + q, 
pelo Lema 17.2, item (b), temos que £ < a. 

Suponhamos que 8 é um ordinal limite e que f restrita a a x y é sobrejetora em 
ay, para todo y < 5. 

Seja ô < ap. Pela definição de af existe y < 5 tal que ð < ay. Em particular, 
ô < ay! e, como 8 é limite, y™ < 8. Pela hipótese indutiva existem E€ E a en e B 
tais que ô = am + £, provando a afirmação e o teorema. E 


Corolário 17.7 Para todos ordinais a, B e y vale (aß)y = alby). 


Demonstração: Existe uma bijeção natural entre (a x 8) x y eax (8x9). É 
fácil verificar que essa bijeção preserva a ordem antilexicográfica. Logo, pelo Teo- 
rema 17.6 e pelo Lema 16.10 temos (aß)y = a(8y). Deixamos os detalhes para o 
leitor completar. E 
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Exponenciação de ordinais 


De um modo análogo à definição de multiplicação de ordinais a partir da soma, 
definimos a exponenciação a partir da multiplicação. É bom salientar que a ex- 
ponenciação de ordinais não é igual a exponenciação de cardinais, que veremos no 
próximo capítulo. 


Definição 17.8 Dados dois ordinais a e 5 definimos a potência a - 8 através das 
seguintes regras: 


e a? =Q. 


e Se 8 é ordinal limite, então af = sup{a? : y < B}. 


Exercícios 


1. Prove que a + 5 é um ordinal sucessor se, e somente se, 8 é sucessor. 
2. Prove que a multiplicação de ordinais não é comutativa. 

3. Prove que 2” = w e w” # w. 

4. Formalize a definição de e = supfw,wº w,.. 1. 


5. Exiba subconjuntos de Q isomorfos (com a ordem herdada da ordem dos racionais) 
aos seguintes ordinais: 


(a) w2 
(b) w? 
(c) «? 
(d) w” 
(e) £ 
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Capítulo 18 


Cardinais 


Aprendemos na gramática da língua portuguesa que existem dois tipos de numerais: 
os ordinais, usados para contagem (primeiro, segundo, terceiro, etc.), e os cardinais, 
usados para expressar uma quantidade (um, dois, três, etc.). Algo semelhante acon- 
tece na matemática. Vimos nos capítulos anteriores que os ordinais são utilizados 
para representar os conjuntos bem-ordenados, que extrapolam a ideia da contagem. 
Para representar a quantidade de elementos de um conjunto, utilizamos os cardinais. 
No entanto, na matemática tratamos de conjuntos infinitos, em que — diferentemente 
do que acontece com os números naturais — os cardinais de fato assumem um papel 
diferente dos ordinais. 


Definição 18.1 Um ordinal «x é um cardinal se k não é equipotente a a, para todo 
Q<R. 


Lema 18.2 Todos os elementos de w são cardinais. 


Demonstração: Segue imediatamente da definição e do Lema 14.8 e do Teo- 
rema 14.9, já que esses provam que um natural n não é equipotente a m < n, nem w 
é equipotente a qualquer natural. E 


Teorema 18.3 Para qualquer conjunto X existe um único cardinal k tal que k é 
equipotente a X. 


Demonstração: Pelo Princípio da Boa Ordem existe uma boa ordem < sobre X. 
Pelo teorema da contagem existe um ordinal a isomorfo a (X, <). Em particular, a 
é equipotente a X. Seja 

k=min{ß <a: Bx X} 


Como o próprio a satisfaz a ~ X temos que «K está bem definido. Está claro que «K 
é equipotente a X. Se existisse 5 < «K equipotente a «K, teríamos 5 equipotente a X, 
contradizendo a minimalidade de «. 

Se tivermos « e K’ cardinais diferentes equipotentes a X, teríamos « e K’ equipo- 
tentes, entre si. Pelo princípio da comparabilidade de ordinais, temos «s < K’ ou 
k’ < K, O que contradiz que ambos são cardinais. E 
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Definição 18.4 Seja X um conjunto. Denotamos por |X| o único cardinal equipo- 
tente a X, que será chamado de cardinalidade de X. 


Lema 18.5 Se X é um conjunto de cardinais, então |) X é um cardinal. 


Demonstração: Seja k = |J X. Se X possui máximo, então «K é o máximo de X 
e, nesse caso, temos «K € X e, portanto, «x é um cardinal. Assumimos, então, que X 
não possui máximo. 

Pelo Teorema 16.7 sabemos que « é um ordinal. Suponha que existe À < «x tal 
que À é equipotente a «k. Como X não tem máximo, existem é,ņ € X tais que 
A< é <mn <A. Pelo Teorema de Cantor-Schrôeder-Berstein temos que € e m são 
ambos equipotentes a À (e a K ), contradizendo que eles são cardinais. E 


Lema 18.6 Se a é um ordinal infinito, então a x 2 é equipotente a a. 


Demonstração: Podemos assumir que a é um ordinal limite, visto que a +n é 
equipotente a a, para qualquer natural n. Defina f:ax2 — a como 


f(B8+n,0)=8+2n 


H58+n,D)=8+(2n+1) 


para 5 um ordinal limite e n € w. Pelo Lema 17.2 item (d) todo ordinal se escreve 
de forma única como soma de um ordinal limite e um número natural. Portanto, f 
está bem definida. Como a é limite, a imagem de f está contida em a, e claramente 
f é bijetora. E 


Lema 18.7 Se X e Y são conjuntos infinitos, |X UY 


é o máximo entre |X| e |Y]. 


Demonstração: Suponha que |Y| < |X|. Suponha ainda que Y N X = Ø (se não 
for, considere, no lugar de Y, Y’ = Y = X, e teremos XUY = XUY”). Sejam « = |X| 
e à = |Y], e considere f e g bijeções entre x e X e entre À e Y, respectivamente. 
Temos que f é uma função injetora de k em X UY. Logo k < |X UY]. Defina 
h: XUY —> k x 2 como 


f F), 0) sere xX 
p À (g1(x),1) sexeY 
Como À C «K, temos que h está bem definida e é injetora, logo XUY < k x2. 


Portanto, pelo Lema 18.6, XUY = K. Pelo Teorema de Cantor-Schróeder-Bernstein 
X UY é equipotente a «x. E 


Teorema 18.8 Se X é infinito então |X x X| = |X|. 


Demonstração: E 
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Álef: Veremos a seguir que podemos “bem ordenar” a classe de todos os cardinais 
através dos ordinais. Para cada ordinal a, podemos pensar no “a-ésimo” cardinal 
infinito. Reciprocamente, todo cardinal é o “a-ésimo” cardinal, para algum ordinal 
a. Para representar os cardinais enumerando-os através dos ordinais, utiliza-se a 
primeira letra do alfabeto hebraico, que é a letra N (leia-se álef). 


Definição 18.9 Para cada ordinal a definimos o ordinal Ny recursivamente da 
seguinte forma: 


e Xo = w; 

e Na+ é o menor cardinal maior que Na; 

e Se a é limite, Na = sup{Ng : 8 < a}. 
Teorema 18.10 (a) Xa está bem definido e é um cardinal, para todo ordinal a; 
(b) Ng < Na se, e somente se, B < a; 


(c) Para todo cardinal k infinito existe um único ordinal a tal que k = Na. 


Demonstração: A parte (a) pode ser provada por indução. No caso sucessor, Na+ 
é o mínimo do conjunto (À € |[P(Ra)|* : À é cardinal e Xa < AJ. Esse conjunto é 
não-vazio porque o próprio |P(Na)| pertence a ele, pelo Teorema de Cantor. 

O caso sucessor é uma aplicação do axioma da substituição. Se Ng está bem 
definido, para todo 5 < a, então, pelo axioma da substituição, existe o conjunto 
{Ng : 8 <a}. Logo, se a é limite, basta definirmos Ny como a união desse conjunto, 
e utilizamos o Lema 18.5 para provarmos que essa união é um cardinal. 

A parte (b) é imediata da definição e deixamos como exercício. 

Para a parte (c) usamos indução transfinita. Suponha que « seja o menor cardinal 
que não é da forma Na. Considere S o conjunto dos cardinais pertencentes a x. Se S 
tem máximo, então, sendo À o máximo de S, temos, por hipótese indutiva, que existe 
y tal que À = Xy. Por definição isso implica que k = N+. Se S não tem máximo, 
tome a a união dos ordinais 5 tais que Ng € S. Pelo item (b) é fácil verificar que, se 
b <a, então N E€ S. Disso segue facilmente que «K = Na- E 


Definição 18.11 Dizemos que «x é um cardinal limite se k = Na, onde a é um 
ordinal limite. Se k = Ná, onde a é um ordinal sucessor, dizemos que « é um cardinal 
sucessor. 


Aritmética cardinal. 


Lema 18.12 Sejam A, 4', Be B' conjuntos tais que A é equipotente a A' e B é 
equipotente a B'. Temos que 


(a) A x B é equipotente a A' x B'. 
(b) Se ANB=0eA'NB' = Ú, então AU B é equipotente a A'U B'. 


(c) Para todos cardinais k e À existem A e B disjuntos tais que |A| = k e |B| = à. 
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Demonstração: E 


Definição 18.13 (Soma de cardinais) Sejam K e À cardinais. Definimos a soma 
k + À como a cardinalidade de AU B, onde |A| = K, |B|= Ae AOB =f. 


Observe que a soma de cardinais está bem definida graças ao Lema 18.12. 


Definição 18.14 (Multiplicação de cardinais) Sejam « e À cardinais. Defini- 
mos o produto « - À como a cardinalidade de A x B, onde |A| = «k e |B| = å. 


Poderíamos também definir « x À como |k x A|, e a definição acima passaria a 
ser uma consequência do Lema 18.12. 


Definição 18.15 (Exponenciação de cardinais) Sejam « e À cardinais. Defin- 
imos a potência Kò como |2k|, isto é, a cardinalidade do conjunto de funções de 


domínio À e imagem contida em «. 


Observe que há uma ambiguidade na notação das definições acima, pois todo 
cardinal é um ordinal, e estamos utilizando os mesmos símbolos para designar as 
operações aritméticas entre ordinais e entre cardinais, apesar delas não coincidirem. 
De fato, 2º = w, quando consideramo-lo um ordinal. Porém, fazendo essa operação 
entre cardinais, temos 2º > w. 

Para evitar essa ambiguidade, precisamos deixar claro no contexto se a operação 
está sendo efetuada entre ordinais ou entre cardinais. Uma outra alternativa é reser- 
var a letra w para representar os ordinais, e N para os cardinais. Usaremos a notação 
wa no lugar de Na quando estivermos nos referindo a ele como ordinal, não como 
cardinal. Assim, quando escrevermos 2º! estamos nos referindo a essa operação 
sendo feita entre os ordinais, que terá como resultado w; (veja exercício no final de 
capítulo). Quando escrevermos 25, referimo-nos à exponenciação de cardinais, e 
teremos 2! > Ny. 

Veremos no Teorema 18.17 que essa ambiguidade não existe para os cardinais 
finitos: as operações de soma, produto e exponenciação coincidem com as corre- 
spondentes para cardinais, que, por sua vez, coincidem com as operações usuais de 
números naturais. 


Lema 18.16 Sejam k, A e 0 cardinais. Considerando a exponenciação entre cardi- 
nais, temos as seguintes igualdades: 


(a) (Kò) = KA- 6); 
(b) 2 = [P(K)]. 


Demonstração: E 
Teorema 18.17 Sejam k e À cardinais. 


(a) Ser e À são cardinais finitos, então k+ AÀ, K: À e kò coincidem com a operação 
correspondente em ordinais; 


(b) Ser ou à é infinito, e ambos são maiores que O, então k +A er- À são ambos 
iguais ao máximo entre k e À. 


(c) Se2 <r <A eA é infinito então kò = 2>. 
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Demonstração: E 


É imediato do Teorema 18.17 que a soma e produto de cardinais são comutativos 
e associativos. 

A seguir, enunciamos uma definição que, na verdade, nada mais é que uma 
notação, bastante comum na linguagem cotidiana da matemática, mas que exige 
um certo cuidado em termos de formalização. 


Definição 18.18 Uma sequência indexada em I é uma função cujo domínio é T. 
Denotamos por (x;);er a sequência {(i, z;): i € I}. 


Essa definição facilita introduzirmos a notação para produto cartesiano infinito. 


Definição 18.19 Seja (X;);cr uma sequência indexada em I. Definimos o produto 
cartesiano de (Xi)icr como o conjunto das funções f de domínio T tais que f(i) € X;, 
para todo i. Denotaremos tal produto por | [;e; Xi. 

Definimos a união da sequência (X,;);er como a união de sua imagem, e a deno- 
tamos por ,., Xi- 


Com essas definições, falaremos agora de soma e produto infinitos de cardinais. 
Antes, como fizemos no caso da soma e produto de dois cardinais, enunciaremos um 
lema. 


Lema 18.20 Sejam (A;);er e (Al)ier duas sequências tais que A; é equipotente a Ai, 
para todo i. 


| Hier Ail = | Hi Ail; 
Se ANA; E O e A; NA; =Q, para todos i,j € I tais que i £ j, então |U;cr Ail = 
[User Mil. 
Demonstração: E 


Definição 18.21 Seja (k;);er uma sequência de cardinais. Seja (A;);er é uma sequência 
de conjuntos tal que |A;| = ki, para cada i € I. Definimos 


(a) Dyer ti = |U;ier 4il, se ANA; =D, quando i £ j. 
(b) [er ti = | Hier 4il- 


Notamos que há mais um abuso de notação na definição acima: o mesmo símbolo 
é utilizado tanto para o produto infinito de cardinais quanto o produto cartesiano 
indexado em T. 


Teorema 18.22 Seja (ki)ic2 uma sequência de cardinais. Então J ;cs Ki = Ko + K1 


€ Thes Ki = Roc K1. 
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Demonstração: E 


Teorema 18.23 (König) Sejam I um conjunto não-vazio e (Aj)ier e (ki;)ier duas 
sequências de cardinais indexadas em I tais que À; < ki, para todo i E I. Então 


>; <] [~ 


iel icI 
Demonstração: EB 


Cofinalidade. 


Definição 18.24 Seja a um ordinal. Definimos a cofinalidade de a como o menor 
ordinal x para o qual existe uma sequência (ac)e<x tal que a = suplar : É < ry}. 
Denotamos a cofinalidade de a por cf(a). 

Dizemos que « é um cardinal regular se cf (k) = k, e singular caso contrário. 


Lema 18.25 Um cardinal k é regular se, e somente se, existe uma família (ke)gex 
tal que A < k, ke < K, para todo Ẹ € À, e 


k= e k 


Demonstração: E 
Teorema 18.26 Seja a um ordinal. 

(a) cf(a) é um cardinal regular. 

(b) Se a é um ordinal sucessor, então Ny é um cardinal regular. 


(c) cf(R) > Na. 


Demonstração: E 


Exercícios 


1. Prove que todo cardinal infinito é um ordinal limite. 

2. Prove que 2º! = w, lembrando que w, é o cardinal N; visto como ordinal. 

3. Prove que, para todo ordinal a, existe 8 > a tal que Ng é um cardinal singular. 
4. Podemos ter 25º = R$? Justifique. 


5. Assumindo a hipótese generalizada do contínuo (23º = Ny, para todo a), 
calcule NÈ! 


